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SEQUENCES EN AMONT DU GENE SM 22, VECTEURS LES 
CONTENANT ET LEURS UTILISATIONS THERAPEUTIQUES, 

NOTAMMENT 
DANS LE TRAITEMENT DES MALADIES VASCULAIRES 

5 

La presente invention est relative a des sequences en amont d'un 
gene exprime dans les cellules du muscle lisse. tel que SM 22, ainsi 
qu'a des vecteurs les contenant. 

Elle a en outre pour objet Tutilisation de ces vecteurs et sequences 

10 en therapeutique, par example pour la production de polypeptides actifs 
localement ou de maniere systemique. notamment des polypeptides 
immunogenes, des polypeptides regulateurs endogenes tels que les 
cytokines, ou encore pour la production d'ARN d'interet therapeutique, 
par exemple un ARN anti-sens . De maniere particuliere, I'invention a 

15 pour objet Tutilisation des vecteurs et sequences nucleotidiques dans le 
traitement des maladies vasculaires. 

Uatherosclerose est une maladie degenerative des arteres 
associant les lesions de Tarteriosclerose et de I'atherome, et combinant 
ainsi un durcissement des arteres et une degenerescence graisseuse de 

20 teur tunique interne. Cette insuffisance coronarienne est generalement 
remediee par une angioplastie coronatre percutanee consistent a 
introduire dans le reseau arteriel coronaire un catheter muni a son 
extremite d'un balionnet, d'avancer le catheter jusqu'au niveau de la 
stenose et de gonfler le ballonnet afin d'ecraser la lesion contre la paroi 

:5 et de retablir ainsi un calibre coronaire permettant une perfusion 
myocardique suffisante. 

Cette technique de revascularisation myocardique est tres 
iargement utilisee (50 000 interventions par an en France et 500 000 
interventions par an aux Etats-Unis) mais est cependant limitee par la 

*o reapparition, dans les mois suivants Toperation, d'une nouvelle lesion au 
site dilate, ou restenose, dans environ 30 % des cas. 

Les divers traitements proposes pour traiter ce type de lesions sont 
resumes dans rarticle de FELDMAN et STEG : "Perspective de la 
therapie genique de la restenose" (Medecine/Sciences, synthese 1996. 

:o 12,47-55). 
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Deux mecanismes sont responsables des restenoses 
I'hyperplasie intimate et le remodelage artertel. Le premier de ces 
mecanismes, I'hyperplasie intimate est due a la proliferation des cellules 
musculaires lisses dans I'intima, qui aboutit a la synthese d'une 
volumineuse matrice extra cellulaire. Cette activation serait induite par la 
liberation locale de facteurs de croissance, et de cytokines, ainsi que par 
la suppression de la synthese de certains peptides endotheliaux 
antiproliferants. Le second mecanisme, le remodelage arteriei. consiste 
en une reduction du calibre de I'artere sans modification de I'epaisseur 
de la paroi, el done sans proliferation de cellules. 

Ces auteurs decrivent diverses tentatives destinees a inhiber 
I'hyperplasie intimate, par therapie genique, mais dont les resultats se 
sont reveles peu satisfaisants. pour diverses raisons. L'inefficacite du 
transfert est une des raisons generalement invoquee pour expliquer ces 
15 resultats. Ce probleme a ete partiellement resolu par ('utilisation de 
vecteurs adenoviraux. mais d'autres problemes sont apparus, lies a 
I'immunogenicite de ces virus, au risque de recombinaison avec des 
adenovirus sauvages ou au risque de dissemination de ces vecteurs 
dans la circulation systemique. 
20 Ces auteurs citent en outre I'utilisation de sequences promotrices 

specifiques des cellules vasculaires, comme la preproendotheline, ou 
des complexes adenovirus-ligand, comme constituant des voies de 
recherche tres interessantes, sans pour autant developper ces aspects. 
La demande WO 96/05.321 (Rhone Poulenc Rorer S.A.) decrit 
25 aussi des adenovirus recombinants defectifs comportant un gene suicide 
pour le traitement de la restenose. Le gene suicide peut etre place sous 
le controle d'un promoteur actif dans les cellules musculaires lisses 
vasculaires. Seul le promoteur de I'actine a du muscle lisse est cite dans 
le cadre de ce mode de mise en oeuvre. Aucun exemple d'utilisation 
•'0 d'une telle construction ne vient illustrer cette demande. 

Les proteines constituant les muscles lisses ont fait i'objet d'etudes 
parcellaires. Ainsi. la proteine SM 22, qui constitue un des premiers 
marqueurs a apparaitre lors de la differenciation des cellules de muscles 
lisses. a ete etudiee et la partie codante de son gene a ete sequencee 
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Chez la souris (SOLWAY et AL, 1995. J. Biol. Chem. 270.22, 13460- 
13469) et Chez le rat (KEMP et AL, 1995. BIOCHEM. J. 310.1037-1043). 

Les sequences du gene de poulet et du gene humain ont aussi ete 
determines (Nishida et al, 1991, Biochem. Int.. 23.663-668 pour le gene 
5 de poulet ; Thweatt et al, 1992, Biochem. Biophyse. Res. Comm.. 187,1- 
7 pour le gene humain). 

Le gene codant pour la proteine SM 22 alpha chez la souris est 
compose de cinq exons et comprend 5,2 kb. II est present en une seule 
copie dans le genome. SOLWAY et al. ont montre que les 441 paires de 
!0 base en amont de la region codante du gene etaient necessaires et 
suffisantes pour induire un taux important de transcription d'un gene 
reporteur, dans des cultures cellulaires primaires d'aortes de rats et 
dans les lignees Ayrs. lis ont d'autre part mis en evidence que les ARN 
messagers de ce gene etaient exprimes a des taux importants dans 
15 I'aorte, dans I'uterus, dans les poumons et dans I'intestin. 

KEMP et al (1995. BIOCHEM. J. 310, 1037-1043.) ont clone et 
sequence le fragment de 1,9 kb en amont de la sequence codante du 
gene SM 22 de rat. Des deletions effectuees dans le fragment ont 
montre que la region du promoteur comprise entre les nucleotides +65 et 
20 -303 etaient plus actives qu'un fragment de 1,5 kb comprenant une 
partie importante de la region du gene non traduite, ce qui suggererait la 
presence de sequences regulatrices a I'extremite 5' du promoteur. 

OSBOURN et AL (1995. Gene, 154, 249-253) ont aussi etudie la 
region 5' en amont du gene SM 22 du rat. lis ont mis en evidence !a 
25 presence de deux introns dans cette region. 

On notera que ces etudes ont ete faites in vitro en utiiisant des 
cultures de cellules primaires de I'aorte. et non in vivo. Or, ces 
conditions d'experimentation ne sont pas representatives de I'activite 
des genes dans les cellules de I'organisme. 
■^0 De plus, elles ne concernent qu'une region tres limitee de la partie 

non codante du gene situee a I'extremite 5'. c'est-a-dire la partie en aval 
du nucleotide -441 . 

Plus recemment Li et al. (1996, J. Cell. Biol, 132, 849-859) ont 
etudie la regulation du gene SM22 a I'aide de souris transgeniques. 
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Neanmoins. cet article ne mentionne aucune application de 
vecteurs portant des fragments de ce gene, et en tout etat de cause 
aucune application therapeutique. 

En outre un nombre limite de constructions ont ete fabriquees, et 
de maniere generate seul i'effet sur des embryons, et non sur des 
adultes, a ete teste. 

Les auteurs deduisent de leur etude que les sequences comprises 
entre les nucleotides -2735 et -445 ne contiennent pas d'elements 
regulateurs musculaires essentiels. 

Le demandeur s'est attache a identifier in vivo, sur des individus 
adultes Tactivite des diverses regions constituent la region en amont de 
la sequence codante exprimee du gene de la proteine SM 22. II s'est 
dautre part attache a determiner si des modifications dans cette 
sequence induisait les changements dans I'expression du gene dans les 
15 differents tissus. 

11 a mis en evidence de maniere surprenante qu'il etait possible , en 
modifiant la region en 5' du gene de la proteine SM 22 de souris. 
d'obtenir. chez des individus adultes. une expression specifique d'un 
gene reporteur dans les muscles lisses des arteres et en particulier de 
20 Faorte. 

II a en outre montre que les sequences identifiees par LI et al. 
(1996, precedemment cites) comme ne contenant pas de sequences 
regutatrices essentieiles, contenaient au contraire des sequences 
indispensables a une expression specifique du gene SM 22 chez 
25 I'adulte. 

II a enfin montre de maniere surprenante que des sequences 
introniques etaient necessaires pour Tinduction d'une expression 
specifique dans les arteres. 

La presente invention a done pour objet une sequence d'ADN 
>o caracterisee en ce qu'elle comprend : 

- un fragment de la sequence en amont de la partie codante du 
gene de la proteine SM 22. ou d'une sequence hybridant dans des 
conditions fortement stringentes a ladite sequence en amont. ledit 
fragment etant susceptible d'induire une expression specifique in vivo de 
?5 ce gene dans des cellules des arteres, et 
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- une sequence codant pour une proteine, ou un ARN, d'interet 
therapeutique . 

Uinvention concerne egatement toute sequence nucleotidique ou 
oligonucleotide d'origine naturelle ou obtenue par synthase chimique 
5 presentant une homologie avec la sequence SEQID n**1 d'au moins 70 

%. 

On entend par sequence nucleotidique d'origine naturelle, un 
fragment d'ADN complementaire obtenu par transcription inverse de 
TARN messager cellulaire ou encore un fragment d'ADN genomique 
10 obtenu apres clivage de TADN cellulaire a Taide d'enzymes de 
restriction. 

On entend par sequence nucleotidique obtenue par synthase 
chimique un fragment d'ADN de sequence connue genere par synthese 
automatique de polynucleotides, par exemple a I'aide d'un appareit 
15 automatique adapte. 

On entend par proteine ou ARN d'interet therapeutique une 
molecule susceptible d'inhiber la croissance des cellules du muscle 
lisse, d'activer la croissance des cellules endotheliales. de consolider 
les arteres et/ou capable d'induire une reponse immunitaire cellulaire ou 
20 humorale. 

Pour la presente invention, le terme "conditions fortement 
stringentes" est utilise dans le sens donne par Maniatis et al.. 1982 
(Molecular cloning . A Laboratory Manual. Cold Spring Harbor Lab. 
CSH, NT. USA ou I'une de ses recentes reeditions. A titre prefere, les 

25 conditions d'hybridation sont telles que decrites par Maniatis (edition de 
1982). Trois lavages destines a etiminer les fragments non hybrides sont 
necessaires et sont effectues a 65''C en presence de 0,2 SSC et 0,1 % 
SDS. en I'absence de formamide. 

De maniere avantageuse, ladite sequence comprend un fragment 

30 de la sequence comphse entre les nucleotides 
-2126 et +4135. dont la sequence SEQ ID n**! est donnee en annexe, de 
la sequence comprise entre les nucleotides 
-2126 et +65 dont la sequence SEC ID n** 2 est donnee en annexe ou 
encore de la sequence comprise entre les nucleotides -2125 et -445 

:^5 dont la sequence SEQ ID N'^S est donnee en annexe. 
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Elle peut aussi comprendre un fragment de la sequence SEQ ID N" 

4 . 

Un tel fragment peul en particulier comprendre au moins une partie 
de la sequence SEQ ID N'S qui correspond a la partie en amont de 
I'extremite 5' de la partie codante comprise entre les nucleotides -2126 
et -1340. Une telle sequence SEQ ID N^S dont la sequence est donnee 
en annexe constitue un objet de la presente invention. 

Les sequences SEQ ID n' 2 et SEQ ID n" 1 sont comprises 
respectivement dans les plasmides p2126nlz et p2126INTnlz portees 
par les souches deposees le 25 mars 1996 aupres de la Collection 
Nationale de Culture de Microorganismes de I'Instltut Pasteur (CNCM) 
respectivement sous les n" 1-1685 et 1-1686. 

L'invention a egalement pour objet les sequences hybridant dans 
des conditions de forte stringence avec les sequences SEQ ID n° 1, 
SEQ ID n° 2, SEQ ID n° 3 et SEQ ID N° 5. 

Les sequences incluant la sequence du premier intron du gene SM 
22, et en particulier la sequence SEQ ID N° 1 constituent des modes de 
mise en oeuvre particulierement avantageux de la presente invention, 
car elles permettent une expression de proteines ou ARM d'interet 
therapeutique, chez I'adulte, specifique des arteres. 

La presente invention n'est neanmoins pas restreinte a des 
sequences contenant des fragments du gene de souns, mais concerne 
toute autre sequence de toute autre espece ayant les memes propnetes. 
a savoir d'induire specifiquement une expression d'un gene dans les 
cellules des arteres. Ainsi, I'homme du metier pourra avantageusement 
se referer a Tarticle de KEMP et AL (1995, precedement cite) qui decrit 
la sequence en amont du gene de rat de la proteine SM 22. La presente 
invention couvre aussi toute sequence comprenant des fragments des 
sequences en amont de genes de la proteine SM 22, modifiees par 
exemple par deletion de certaines structures qui conservent des 
fonctions identiques ou similaires a celles de la sequence complete. 

La proteine d'interet therapeutique peut etre une proteine induisant 
la formation d'un compose cylotoxique. telle que la thymidine kinase du 
virus de I'herpes. Cette proteine presente la particularite de transformer 
le ganciclovir (Merck Index, reference 4262). un analogue de la 
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guanosine, en un derive qui bloque la synthese de I'ADN dans les 
cellules en replication. L'introduction d'un gene codant pour cette 
proteine dans les sequences selon la presente invention permet done de 
bioquer la proliferation des cellules dans le cas de I'hyperplasie infimale. 

5 Une sequence codant la thymidine kinase est notamment decrite par 
Caruso et Klatzmann (1992. Proc. Natl. Acad. Sci.. USA, 89, 182-186). 

Ladite proteine d'interet therapeutique peut aussi etre une proteine 
presentant un effet cytostatique, telle que la proteine codee par le gene 
Rb (Chang et al., 1995. Science, 267, 518-522), ou par le gene eNOS 

10 (Hamon et aL, 1994, Circulation, 90. 1357-1362).. 

Elle peut aussi etre une proteine presentant une activite lipolytique, 
telle qu'une lipoproteine lipase. De telles proteines sont codees par les 
sequences decrites par Reyner (1995, Nature Genetics, 10, 28) et Ming 
Sun Liu (1994, J. Biol. Chem, 269-11417). 

15 Elle peut aussi etre un facteur de croissance des cellules 

endotheiiales. Une telle proteine peut etre en particulier une 
interleukine. 

Elle peut etre une proteine musculaire, telle que la myosine, ou 
I'actine. ou encore une proteine de structure tissulaire telle que le 

20 collagene ou I'elastine. 

Elle peut etre une proteine induisant une reponse immunitaire telle 
que decrite dans la demande WO 90 11092, et en particulier un 
antigene viral tel que la glycoproteine gp120 ou la proteine Nef du VIH 
(virus de rimmunodeficience humaine). 

25 De maniere generale, ladite proteine peut etre une ou plusieurs 

proteines presentant un interet therapeutique ou vaccinal, telles que des 
proteines d'interet immunotherapeutique, par exemple des interleukines, 
les facteurs de croissance, par exemple les facteurs de croissance des 
fibroblastes (FGF) ou le NGF (Nerve Grovi^h Factor), des proteines 

30 pouvant induire une reponse immunitaire, que ce soit une immunite 
humorale, cytotoxique ou cellulaire, ou des proteines permettant de 
complementer I'activite d'un gene normalement exprime chez Tindividu a 
traiter mais qui ne Test plus, soit par mutation ou deletion de sa 
sequence. 
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Cette sequence peut aussi coder pour un ARN d'interet 
therapeutique. Un tel ARN peut etre TARN antisens de la proteine p 53 
ou un ARN tel que decrit dans la demande WO 90 1 1092. deposee par 
la societe VICAL 

5 La presente invention a en outre pour objet des vecteurs 

caracterises en ce qu'ils contiennent une sequence selon Tinvention, 
telle que decrite ci-dessus. Un tel vecteur peut contenir tout autre 
sequence d'ADN necessaire a {'expression de la proteine, ou de I'ARN, 
d'interet ttierapeutique dans les tissus cibles. et en particulier peut 
10 contenir une origine de replication efficace dans les cellules des arteres, 
en particulier dans les cellules du muscle lisse. 

Un tel vecteur peut comprendre des sequences permettant la 
recombinaison homologue chez Torganisme traite, specifique du gene a 
remplacer, tesdites sequences etant placees en amont et en aval de la 
15 sequence selon I'invention. Du fait de la presence de telles sequences, 
le gene non desire, present dans I'organisme traite sera remplace par le 
g§ne porte par le vecteur ou la sequence et que I'on desire voir 
s'exprimer dans Torganisme. 

Une telle methode de recombinaison homologue peut etre du type 
20 de celle decrite par Le Mouellic et al.. {1990, Proc. Nat. Acad. Sci. USA , 
87, 4712-4715) ou dans la demande PCT WO 91/06,667. 

Un tel vecteur peut etre un vecteur derive d'un adenovirus. Des 
adenovirus adaptes a la mise en oeuvre de la presente invention sont en 
particulier ceux decrits par FELDMAN et STEG (1996, precedemment 
25 cite) ou OHNO et al (1994, Sciences, 265, 781-784) ou encore dans la 
demande FR 94.03.151 (Institut Pasteur, Inserm). Ces virus sont 
generalement rejetes par I'individu. du fait de leur trop forte 
immunogenicite. Neanmoins. des souches de ces virus ont ete 
selectionnees afin de diminuer leur caractere immunogene. En tout etat 
?o de cause, ces vecteurs, meme presentant une forte immunogenicite. 
peuvent etre utilises dans le cadre de la presente invention, car les 
arteres sont traitees durant des periodes de temps relativement courtes. 
de rordre de quelques semaines, compatibles avec les temps de rejet 
des adenovirus par le systeme immunitaire de I'hote. 
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On notera neanmoins que Tintroduction des sequences selon la 
presents invention dans les vecteurs decrits ci-dessus n'est pas 
indispensable, et que les cellules des arteres peuvent etre directement 
transfectees par de t'ADN comprenant ces sequences. 

5 Les sequences nucleiques selon la presente invention peuvent etre 

introduites apres • couptage covalent de Tacide nucleique avec des 
composes favorisant leur penetration dans les cellules ou leur transport 
vers le noyau, les conjugues resultants etant eventuellement encapsules 
dans des microparticuies polymeres, comme dans la demande 

10 internationate WO 94/27238 de Meidsorb Technologies International. 

Selon un autre mode de realisation, les sequences nucleiques 
peuvent etre incluses dans un systeme de transfection comprenant des 
polypeptides favorisant leur penetration dans les cellules, comme dans 
la demande internationale WO 95/10534 de Seikagaku Corporation. 

15 Ces vecteurs ou sequences peuvent etre administres in situ par 

tout moyen connu de Thomme du metier. Ainsi, ils peuvent etre delivres 
in situ a I'aide d'un catheter a ballonnet recouverl de canaux. tel que 
decrit par FELDMAN et STEG (1996, precedemment cite). 

lis peuvent aussi etre administres au cours d'une operation, ou en 

20 denudant Taorte. Un autre mode d'administration consiste a introduire un 
grillage de faible maillage impregne d'ADN comprenant ces sequences, 
le long de I'aorte ; tel que decrit par Feldman et al. (1995, J. Clin. 
Invest.. 95. 2662-2671). 

Ces sequences ou vecteurs peuvent avantageusement etre 

25 administres sous la forme d'une composition les contenant, par exemple 
dans un gel faciiitant leur transfection dans les cellules des arteres. Un 
tel gel peut etre un complexe de poly-L lysine et de lactose, tel que 
decrit par MIDOUX (1993, Nucleic Acid Research, 21. nM, 871-878) ou 
du poloxamer 407 tel que decrit par PASTORE (1994, Circulation. 90, I- 

?o 517). lis peuvent aussi etre mis en solution dans une solution 
tamponnee ou etre associes a des liposomes. 

La presente invention est en outre relative a des medicaments 
contenant de telles sequences, vecteurs ou compositions, ainsi qu'a des 
compositions pharmaceutiques les contenant en quantites 
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pharmaceutiquement efficaces ainsi que des excipients 
pharmaceutiquement compatibles. 

De tels sequences, vecteurs ou compositions peuvent etre 
avantageusement utilises pour la fabrication de medicaments pour la 
5 delivrance au niveau des arteres d'un ADN (ADNc ou ADN genomique) 
pouvant exprimer notamment un gene codant pour une proteine 
d'inleret, pour le traitement des maladies coronariennes, et en particulier 
pour le traitement de la restenose. Elles peuvent neanmoins etre aussi 
utilisees pour la fabrication d'un medicament pour le traitement de 
10 mutations fragilisant les vaisseaux. Un tel medicament pourrait, par 
exemple. comprendre une sequence ou un vecteur selon invention 
capable d'exprimer un gene codant pour une proteine normale de la 
desmine ou une proteine d'adhesion du muscle du type CAM. 

La presente invention a aussi pour objet des ARN exprimes a partir 
15 des sequences et vecteurs objets de la presente invention, et en 
particulier des ARN messager. 

La presente invention a aussi pour objet un precede de criblage 
de molecules in vitro, en vue de tester leur activite sur les sequences 
regulatrices du gene codant pour la proteine SM 22. Un tel procede 
20 comprendra, par exemple. une premiere etape suivant laquelle on 
transfecte des cellules avec une sequence ou un vecteur selon 
I'invention. comprenant un gene reporteur place sous le controle de tout 
ou partie de la sequence du promoteur du gene codant pour la proteine 
SM 22. Dans une seconde etape, les cellules ainsi transfectees sont 
25 incubees en presence de la molecule a tester, puis I'expression du gene 
reporteur est quantifiee. 

Les cellules utilisees pour la transfection sont avantageusement 
des cellules de muscle lisse, en particulier des cellules de I'aorte, soit 
sous la forme d'une culture primaire, soit sous ia forme d'une Itgnee 
30 cellulaire stable. 

Dans le cas ou les cellules sont transfectees par des 
constructions telles que p2126nlz ou p2126INTnlz, la quantification de la 
beta-galactosidase produite sera avantageusement effectuee par lecture 
optique, par exemple en utilisant la trousse de detection commercialisee 
35 par Boehringer sous la reference 1 669 893 (catalogue Boehringer- 
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Mannheim - « Biochemicals ». 1996, page 236, beta-Gal Reporter Gene 
Assay, Chemiluminescent). 

Dans un autre mode de realisation du precede de criblage in vitro 
selon rinvention, le gene reporteur est le gene codant pour la luciferase. 

5 Dans ce cas. la quantification de I'expression de la luciferase est 
avantageusement effectuee par chimioluminescence, par exemple au 
moyen de la trousse de diagnostic commercialisee par Boehringer sous 
la reference 1 758 241 (catalogue Boehringer-Mannheim 
« Biochemicals », 1996. Luciferase Reporter Gene Assay), 

U) La presente invention est aussi relative a des animaux 

transgeniques et en particulier des souris portant une sequence ou un 
vecteur tel que defini ci-dessus dans lequel le gene codant pour la 
proteine tfinteret therapeutique est remplacee par un gene reporteur. 
La presente invention est enfin relative a un precede de detection 

15 de mutations de la sequence en amont de la partie codante du gene de 
la proteine SM22. De telles mutations sont en effet susceptibles de 
modifier Texpression du gene codant pour la proteine SM22, en 
particulier diminuer ou meme abolir I'expression de ce gene dans les 
muscles lisses. De telles mutations seraient de nature a entrainer une 

20 modification du fonctionnement du muscle lisse, la proteine SM22 etant 
apparentee a une famille de proteines impliquees dans la regulation de 
la fixation du calcium, du type caiponine (Ayme-Southgate et al 1989. J. 
Cell. Biol.). Un tel precede de detection de mutations peut etre 
avantageusement le precede objet de la demande de brevet fran?ais 

25 FR-93 10821. 

De maniere complementaire, des sequences selon rinvention 
modifiees de telle sorte qu'elles permettent une augmentation de 
I'expression du gene SM22 font egalement partie de rinvention. 

De telles souris transgeniques peuvent etre utilisees pour cribler 

?o des molecules pour leur activite sur les sequences regulatrices gene 
codant pour la proteine SM 22. Des molecules peuvent etre 
administrees a des souris, puis apres sacrifice, des coupes 
histologiques sent effectuees afin de mettre en evidence les tissus 
colores par le gene reporteur. 
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Pour la mise en oeuvre de la presente invention, rhorrme du metier 
pourra avantageusement se referer au manuel suivant : "SAMBROK et 
al (Molecular cloning, A Laboratory Manual, Cold Spring Harbor 
Laboratory Press, New York. 1989). ou a l"une de ses recentes 
reeditions. 

La presente invention est illustree sans pour autant etre iimitee par 
les examples qui suivent : 

La figure 1 represente la carte de restriction et la structure 
exon/intron du site SM 22, comprenant la region -2474 a +6030 (par 
rapport au site d'initiation de la transcription). Les exons sont 
representes par des carres blancs tandis que les fleches indiquent la 
position des sequences repetees de type B1. 

La figure 2 represente I'alignement de trois sequences repetees de 
type B1, dans lesquelles les echanges de base sont indiquees. 
13 La figure 3 est un autoradiogramme illustrant 1' identification du site 

d'initiation de la transcription. Le puits P correspond a I'amorce utilisee. 

La figure 4A represente la sequence de la region 5" en amont du 
site d'initiation de la transcription, et de I'exon du gene SM 22. Les sites 
de fixation des differents facteurs sont indiques, ainsi que les differentes 
20 sequences concensus. Les lignes discontinues indiquent la position des 
sequences repetees de type 81 . 

La figure 48 est une carte de restriction schematique du gene SM 

22. 

La figure 4C est une carte de restriction detaillee du gene SM 22. 
25 La figure 5 illustre la fabrication du plasmide p352nlz. 

La figure 6 illustre la fabrication du plasmide p2126 niz. 
La figure 7 illustre la fabrication du plasmide p2126INTnlz. 
Les figures 8A et SB illustrent I'expression du gene lacZ dans des 
embryons de souris transgeniques. Les figures 8A. 8B, representent 
.-0 respectivement des embryons aux stades 12,5 et 1 5,5 jours. 

Les figures 9A a 9D representent des coupes histologiques 
d'embryons colores a I'aide de lacZ. La figure 9A represente une coupe 
d'un embryon au stade 12,5 jours au niveau du coeur, montrant une 
coloration intense exclusivement dans le myocarde du ventricule droit 
.^5 (RV) et dans les parois des arteres. (abreviations : AA : coude de la 
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cuatrieme artere aortique ; CA : artere carotidienne ; E : oesophage ; Iv : 
ventricule gauche : PA : partie proximate de I'aorte ; PT : tronc 
pulmonaire ; RA : atrium droit ; RV : ventricule droit ; T : trachee ; V; 
veine cardinale droite et gauche). 

5 La figure 9B represente une coupe a travers la region abdominale 

d'un embryon au stade 14,5 jours, montrant une coloration des arteres 
ombilicales (UA) et I'absence de marquage des visceres (B: vessie ; D : 
duodenum ; H : gros intestin ; L: foie ; M : intestin grele ; ST ; estomac). 
La figure 9D est une coupe a travers les segments de la queue au 

10 stade 12,5 jours montrant le marquage dans le myotome (my) et I'artere 
de la queue (a). 

La figure 9C est un agrandissement de la partie de la photographie 
correspondent a I'artere ombilicale au stade de 12,5 jours, montrant un 
marquage exclusif de la couche musculaire (m) et une absence de 

15 marquage de Tendotheiium (e). 

Les figures 10A a IOC illustrent {'expression du transgene dans 
des souris adultes. 

La figure 10A represente une vue de dessus de I'ensemble du 
coeur montrant un intense marquage de i'aorte (a) et de I'artere 

20 pulmonaire (pa) et une absence de marquage de la veine cave (vc). Les 
figures 10B et IOC sont des coupes a travers la couche de muscle lisse 
(sm) du colon de I'adulte et d'une artere mesentere adjacente (ma). Le 
marquage de lacZ (figure 108) montre que I'expression du transgene est 
restreinte a i'artere, tandis que rimmunofiuorescence avec des anticorps 

25 SM 22 (figure 10C) met en evidence I'expression du gene SM 22 
endogene dans les cellules du muscle lisse aussi bien de I'artere que du 
colon. 

La figure 11 represente un vecteur comportant les regions 
reguiatrices du gene SM 22 et le gene codant la thymidine kinase du 
30 virus de I'herpes. 

Les figures 12A a 12D illustrent {'expression de la construction 
SM 445 niz dans des embryons de 15,5 jours p.c. (figures 12A a 120) et 
dans un adulte de 2 mois (figure 12D). 
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EXEMPLES: 
Materiels et methodes 

1. Clonaqe et caracterisation du gene de la so uris SM 22 

Environ 10^ phages recombinants d'une banque genomique de 
souris c57/bl construite dans le phage delta-EMBL 3 (fourni par Dr D. 
Plachov, Munster, Ailemagne) ont ete cribiees en utilisant le fragment 
BAL l/Eco RV de 890 bp de I'ADN complementaire de la proteine de 
souris SM22 ( Almendral et al, 1989 ; Exp. Cell Res. 181, 518-530), 
comme sonde. La sonde a ete marquee radioactivement par initiation 
aleatoire et I'ADN a ete hybridee sur des filtres laisses durant une nuit a 
65°C dans un tampon de Church. Les filtres ont ete ensuite laves dans 
du 0.2 X SSC/0,1 % SDS a SS'c et des plaques positives ont ete 
purifiees et homogeneisees par trois recriblages successifs dans des 
conditions identiques. L'un des clones isoles s'est revele contenir un 
15 locus SM 22 entier. II a ete ensuite cartographie a I'aide d' enzymes de 
restriction et sous-clone. Afin d'eviter des rearrangements durant les 
procedures de clonage, une analyse par hybridation de type Southern 
de I'ADN genomique de souris et des clones genomiques a ete effectuee 
et les figures de restriction des fragments ont ete comparees. 

La sequence du gene SM 22 a ete determinee sur les deux brins 
par la methode de terminaison de chaine ( Sanger et al, 1977, Proc. 
Natl. Acad Sci. 74. 5463) en utilisant le kit Sequenase V2.0 (United 
States Biochemical, Cleveland, Ohio). 

2. Hybridation de tvpe Northern, extension oar amorce. 
5'RACE. et analyse de protection par RNAse 

De I'ARN total de lignees cellulaires et de tissu de souris adulte a 
ete isolee par la methode de Chirgwin et al, (1979, Biochemistry, 18. 
5294-5299) modifies. Pour I'isolement des ARN messager, le kit Oligotex 
(Quiagen Inc, Chatsworth. CA) a ete utilise en suivant les instructions du 
fabricant. 

Les analyses par hybridation de type Northern ont ete effectuees 
en utilisant des gels d'agarose contenant du formaldehyde et par 
hybridation capillaire sur des membranes Hybond-N (Amersham Life 
Science. Little Chalfont. Royaume Uni) selon les methodes connus de 
I'homme du metier. 



20 
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Pour les analyses par extension d'amorce, un oligonucleotide 
synthetique de 30 nucleotides (P27N1) complementaire de ta sequence 
+36 a +65 de I'ADN complementaire du gene SM 22 presentant la 
sequence SEQ ID N** 6 : 

5 (5'-AAGGCTTGGTCGTTTGTGGACTGGAAGGAG-3). a ete 

marque par de la polynucleotide kinase T4. 5 pg d'ARN messager 
d'uterus de souris ont ete hybrides a 55X avec 1-2 X 10^ cpm de sonde 
purifiee et ta reaction d'extension d'amorce a ete effectuee en utilisant 
les procedures de laboratoire connues de Thomme du metier, Les 

10 resultats sont analyses par electrophorese sur des gels de 
polyacrylamide denaturants a 6 %. Une reaction utilisant la meme 
amorce a ete chargee dans un puits adjacent afin de permettre une 
determination directe du site d'initiation de la transcription. 

La methode 5'RACE a ete effectuee en utilisant deux 

15 oligonucleotides synthetiques antisens de 18 bp correspondant aux 
bases +112 a +129 (amorce 2) et +162 a +179 (amorce 1) de I'ADN 
complementaire SM 22, tel que decrit en substance par FROHMAN et al, 
(1988. Proc. Natl. Acad. Sci, 85, 8998-9002). 

En vue des analyses de protection par la RNase, un fragment 

20 cbtenu par PGR de 417 bp comprenant la region -352 a +65 du gene du 
SM 22 a ete fabrique et clone par la methode des bouts collants dans le 
site HinC II du vecteur pBluescript SK+. La sequence du fragment 
obtenu par PGR a ete verifiee. Afin de generer une sonde ARN antisens 
marquee radioactivement, la construction a ete linearisee avec Sph I a 

25 la position -203 du gene SM 22 et transcrite avec de la RNA polymerase 
Ty en presence de 32p.cTP. La sonde (3 X 10^ cpm) a ete hybridee 
avec 5 pg d'ARN messager d'uterus de souris a 42**C durant une nuit, 
Apres hybridation, les echantillons ont ete incubes avec des RNases A 
et T (1 heure a 37°C), precipites, et analyses comme decrits pour 

50 I'anatyse par extension d'amorce. 

3. Culture cellulaire et transfection 

Les lignees cellulaires NIH 3T3. 10T1/2 et 8/47 ont ete cultivees 
dans du DMEM (Life Technologies, Inc. Vienne, Autriche) 
complemenlees avec 10 % de serum de foetus de veau (Hyclone 
35 lnc.,Etats-Unis) a 37°C, dans une atmosphere de Co2 a 7%. 
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Pour les experiences de transfection, des cellules confluentes ont 
ete etalees, repiquees dans des boites de Petri de 6 cm, et laissees 
croltre jusqu'a obtenir approximativement une confluence de 75 % avant 
ajout du melange de transfection. 

Les transfections ont ete effectuees en utilisant le reactif 
Lipofectamine commercialise par Life Technologies Inc.. 

En resume 24 pg de Lipofectamine ont ete ajoutes a 6 pg de 
plasmide portant le gene reporteur superenroule et 2 Mg de PCMVIJ gal 
comme temoin interne. Apres ajout de 3 ml de DMEM, le cocktail de 
transfection a ete ajoute aux cellules. Au bout de 6 heures, ce melange 
a ete remplace avec du milieu de croissance contenant 10 % de serum 
et a nouveau change au bout de 12 heures. L'expression du produit du 
gene reporteur a ete analysee apres 24 heures. Pour les experiences de 
stimulation par le serum, des cellules transferees ont ete placees dans 
du DMEM contenant 20 % de serum, 24 heures avant d'etre recoltees. 
4. Dosage de la CAT et de la B-aaia ctosidase 
Les cellules ont ete prelevees sur des boUes de petri avec un 
racloir a cellules, centrifugees, resuspendues dans 150 pi de tampon Z 
(100 mM de phosphate de sodium. pH 7,5, ImM MgCI2, 10 nM KCl, 50 
nMli - mercaptoethanol) et lysees par trois cycles de 
congelation/decongelation Les debris ont ete elimines par 
centrifugation a basse vitesse et I'activite de la (i-galactosidase a ete 
determinee a partir de 2 a 20 pi de surnageant selon les precedes 
connus de I'homme du metier. Pour la determination de I'activite CAT 
selon GORMAN et al (1982 Mol. Cell. Biol.. 2, 1044-1051), de 10 a 100 
pl de lysat ont ete utilises. Afin de tenir compte des variations dans 
refficacite de transfection, I'activite CAT a ete normalisee avec I'activite 
Bgal. 

5. Production des souris transaeniques 

Des inserts des plasmides pnlz2126 et p21261NTnlz. deposes 
aupres de la CNCM respectivement sous les n'l-ISBS et n'l-ISBe, ont 
ete isoles par digestion avec Sal l/Pme I, suivie d'une electrophorese sur 
gel, puis dune purification utilisant le kit Genedean (Bio 101. la Jolla, 
CA) puis resuspendus dans 10 mM de Tris Hcl pH 7,5. 0,25mM EDTA 
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Les animaux transgeniques ont ete produits comme decrits 
precedemment par LI et al (1993. Development. 177/3, 947-959). 

Des souris portant le transgene ont ete identifiees par PGR et 
hybridation de type Southern en utilisant une sonde ADN. La 
5 construction pnlz2126 a permis d'obtenir trois animaux positifs sur 17 
souris, deux d'entre elles transmettant et exprimant cette construction. 

Pour la construction p2126INTnl2 deux animaux positifs sur les 28 
testes ont ete obtenus et a nouveau un seul exprime et transmet cette 
construction. 

10 Les souhs transgeniques ont ete retro-croisees avec des souris 

c57/bl et les colorations histochimiques ont ete effectuees avec des 
souris hemizygotes pour ie transgene. 
6. Colorations histochimiques 

Des embryons entiers ou des tissus d'adultes ont ete fixes durant 

15 15 a 30 minutes a 4X dans du formaldehyde a 1 % dans du tampon A 
(100 mM de phosphate de sodium , pH 7.3,2 mM Mgcl2, 0.1% de sodium 
de deoxycholate. et 0,2 % NP-40). Apres ringage, les specimens ont ete 
colores durant une nuit a 30 °C dans du tampon A contenant 1 mg/ml de 
X - gal (Sigma, St Louis, Missouri), 5 mM de ferrocyanure de potassium, 

20 5mM de ferricyanure de potassium, et 20 mM de Tris-CI pH 7,3. Les 
echantillons colores ont alors ete rinces, deshydrates a I'aide de 
concentrations croissantes d'ethanol, clarifies dans du xylene, et 
enrobes dans de la paraffine. Les coupes histologiques ont ete 
effectuees avec une epaisseur de 7 a 10 [jm et a nouveau colorees avec 

25 de I'hematoxline d'Ehrlich et de I'eosine. Les embryons ont d'autre part 
pu etre a nouveau clarifies a I'aide d'un melange d'alcool benzylique et 
de benzoate de benzyle. 

Pour rimmunohistocoloration, les tissus de souris ont ete fixes 
dans 3 % de paraformaldehyde dans du tampon PBS a 4^*0 durant 3 

30 heures, puis enrobes dans un milieu Tissue-Tek (Reichert-Jung, Vienne) 
et sectionnes sur un cryo-microtome a des epaisseurs de 5 a 10 ^im. Les 
coupes selectionnees ont ete montees et colorees en utilisant un 
anticorps monoclonal dirige a rencontre de la SM 22 (Duband et al. 
1993, Differentiations, 55, 1-11), a une dilution 1/30 ainsi qu'en utilisant 

?5 un anticorps secondaire marque Cy3 (Biological Detection Systems, 
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USA). Les coupes ont ete examinees a I'aide d'un microscope a 
fluorescence. 

EXEMPLE 1. 

Caracterisation du locus SM 22 

5 Le criblage par hybridation de la banque genomique de souris a 

conduit a I'isolement de trois clones se recouvrant, contenant le gene 
complet de la SM 22. Une carte de restriction, qui est partiellement 
reproduite sur la figure 1 a ete etablie et les exons ont ete localises par 
hybridation a I'aide de sondes oligonucleotidiques synthetiques. 

10 Les regions presentant un interet ont ete sous donees et 

sequencees. 

La sequence a ete determinee entre les positions -2474 et +1 10 en 
aval du site de polyadenylation et a ete comparee dans la banque de 
donnees EMBL. Le gene couvre 5923 bp a partir du site de debut de la 
15 transcription jusqu'au site de polyadenylation et la sequence codante est 
partagee en 5 exons (figure 1). Toutes tes frontieres exon-intron 
correspondent a des sequences consensus. 

Le premier exon contient seulement une sequence leader en 5' et 
le codon de depart de la transcription est done localise dans le second 
20 exon separe du site de depart de la transcription par plus de 4kbp de 
sequence d'intron. 

Deux signaux de polyadenylation potentials ont ete localises au 
position 5905 et 5913 et plusieurs regions TGT placees en aval du site 
de polyadenylation, prennent vraisemblablement part dans la 
25 terminaison de la transcription. 

L'analyse de la sequence revele de plus la presence de trois 
sequences repetees (figure 2) qui presentent des homologies 
importantes avec les elements repetes de type B1, dont certains sont 
transcrits par la RNA polymerase 111 et codent pour des ARM 5S. On 
notera que toutes les sequences repetees sont dans une orientation 
inverse par rapport au locus SM 22. 

Le site de depart de la transcription a ete cartographiee par 
analyse par extension d'amorce (figure 3). Un oligonucleotide antisens 
complementaire de I'extremite 3' de Texon 1 conduit a I'obtention de 
35 quatre produits d'extension qui different seulement par une paire de 
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bases (bp) en longueur, le plus long d'entre eux etant de 65 bp. Le 
produit de la transcription demarre done avec un G, 77bp en amont du 
codon d'inittation de la transcription. 

Les produits d'extension les plus courts ont ete vraisemblablement 
5 causes par une terminaison prematuree de ['extension de I'amorce due a 
des modifications (capping) a extremite 5* de TARN messager. 

Ces resultats ont ete confirmes par Tanalyse par protection par la 
RNAse . qui conduit a un fragment protege de 65bp et par le clonage et 
le sequen?age du produit d'extension derive d*une reaction 
10 independante avec une amorce antisens situee dans le second exon du 
gene. 

Ces resultats sont en accord avec ceux de Solway et al (1995 
precedemment cite). Des differences de sequences mineures entre ces 
deux resultats sont vraisemblablement dues a des variations alleliques 

15 entre les differentes souches de souris. 

La sequence TTTAAA en position -28bp (figure 4) est en relation 
etroite avec la sequence TATAAA et a vraisemblablement la fonction 
d'une boite TATA. L'analyse par ordinateur de la sequence en 5' revele 
la presence de plusieurs sites potentiels de liaison pour des facteurs 

20 ainsi que pour des elements qui sont connus comme contribuant a la 
regulation de la transcription de gene musculaires (figure 4). Au total 1 1 
boites de type E (CANNTG), quatre motifs du type Mef-2/rSRF 
(YTAWAAATAR). quatre elements de liaison SRF potentiels 
(CC(A/T)6GG). cinq sites de liaision AP-2 (CCCMNSSS) et cinq motifs 

25 SP1 (GGGCGG) ont ete localises. Enfin, un element similaire au motif 
TGT3-3. recemment identifie comme site de liaison d'un facteur 
nucleaire du muscle lisse et comme contribuant a la regulation de la 
transcription de I'actine alpha du muscle lisse, a ete localise (figure 4). 
EXEMPLE 2 

M\ Clonage et construction de plasmides recombinants pour la 

creation de souris transgeniques 
1. Fabrication de pniz 

Le plasmide pGEM7 (c'est-a-dire le plasmide pGEM-72F (+/-), 
commercialise par Promega Corp., Madison, Wi, USA. Sequences 
disponibles dans Gen Bank, sous les numeros suivants : X65310 et X 
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6531 1 ) comprend un gene de resistance a I'ampicilline, un gene lac Z et 
una origine de replication. II comprend 3000 paires de base. II a ete 
digere avec Nae l/Bsp 1201. L'extremite sortante Bsp 12CI du vecteur a 
ete rendue « bouts francs » avec renzyme de Klenow, et le plasmide a 
5 ete referme en presence d'un linker Sal I de 10 pb. Le fragment lacZ de 
pGEM 7 a done ete delete, un site Sal I introduit, et un site Bsp 1201 
restaure. 

Un site Pme I a ete introduit par insertion d'un linker Pme I avec 
des extremites simple-brin sortantes Nsi I, dans le site Nsi I de la 
10 construction. 

Finalement, le gene lacZ couple au signal de localisation nucleaire 
a ete isole a partir de pDes2.2nlz (LI et al. 1993. precedemment cite) 
avec Hind III et Sac 1 donnant deux fragments du gene rapporteur. 

Les deux fragments ont ete inseres entre les sites Hind III et Sac I 
15 du vecteur pGEM7 modifie et verifies pour leur orientation. Cette 
procedure donne le vecteur pniz sans promoteur. 
2. Fabrication de p352nlz 
La figure 5 illustre la fabrication de ce plasmide. 
Un fragment PGR de 417 pb couvrant la region -352 a +65 du gene 
20 SM 22. dont la sequence se retrouve dans la sequence SEQ ID 1 qui 
comprend I'enchainement des nucleotides - 2126 a + 4135, a ete produit 
et insere dans le site Hinc II rendu bout-franc du vecteur 
pBluescriptSK+. La sequence du fragment PGR a ete verifiee, Le 
fragment est recupere par les sites Xba I et Xho I et insere dans le 
25 plasmide pBLCAT 3 dans les sites correspondants, generant le 
recombinant p352CAT, Pour creer p352nlz. le fragment Xba l/Xhol de 
p352GAT a ete insere dans les sites correspondants de pnlz. 
3. Fabrication de p2126nlz 

Pour creer p2126nlz, un fragment Bsp 1201/Sph I de 1,9 kb 
r>t) recouvrant la region -2125 a -206 du locus SM 22, dont la sequence se 
retrouve dans la sequence SEQ ID H' 1 qui comprend I'enchainement 
des nucleotides - 2126 a + 4135, a ete insere dans les sites respectifs 
de p352ni2. Ce plasmide a ete depose le 25 mars 1996 aupres de la 
CNCM sous le n' 1-1685. Sa fabrication est illustree par la figure 6. 

75 
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4. Fabrication de p2126INTnlz 

La fabrication de ce plasmide est illustree par la figure 7. 
Un fragment Bsp 1201/Hind III de 5,8 kb recouvrant la region -2126 
a +3651 du locus SM 22 a ete insere dans les sites correspondants de 

5 pnlz. donnant pINt-nlz. Ensuite un fragment PGR de 496 pb de la base 
+3648 a +4143 du locus SM 22 a ete genere en utilisant une amorce en 
amont et une amorce en aval confue pour introduire un site Hind III en 
position 4135-4140. Ce produit de PGR a ete digere avec Hind III et lie 
dans le site Hind III de pINT-nIz pour donner p2126INT-nl2. La 

10 construction p2126INTnlz contient done 2126 paires de bases de la 
region en 5' du debut de transcription, le premier exon, le premier intron 
entier et 15 paires de bases du deuxieme exon avec les quatre 
dernieres paires de bases mutees de CATG en GCTT pour eliminer le 
codon d'initiation de traduction et introduire un site Hind III comme 

15 mentionne ci-dessus. La partie de I'insert derive du promoteur de SM 22 
contenu dans te plasmide p2126 INTnlz est constitue par la sequence 
SEQ ID N*1. Ce plasmide a ete depose le 25 mars 1996 aupres de la 
GNCM sous le n°l-1686. Sa fabrication est illustree par la figure 7. 
EXEMPLE 3 : 

20 Expression des constructions p2126 niz et p2126 INTnlz dans 

les animaux transq6niques 

Deux constructions utilisant le gene reporteur lacZ avec signal de 
localisation nucleaire du virus SV 40 ont ete fabriquees, comme decrit 
dans Texemple 2. 

25 La premiere construction, p2126nlz contient 2126 bp de la region 

en amont et le premier exon (65 bp). La seconde construction 
p2126INTnlz est identique a la premiere a I'exception de Taddition du 
premier intron et des premieres 12bp du second exon. 

Comme indique dans la partie Materiel et Methodes, chacune des 

:>o constructions a donne naissance a au moins une souris transgenique 
exprimant le gene reporteur. 

Les embryons obtenus de 12,5 a 15,5 jours apres le coit (dpc) ont 
ete colores de maniere a mettre en evidence I'activite flgal. Les 
expressions des deux constructions sont identiques, a tous les stades 
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Observes, bien que p2126INTnlz donne une coloration un petit peu plus 
intense. 

Uexpression a ele detectee en premier lieu au jour 8,5 dans la 
region du coeur de rembryon et dans les vaisseaux de I'enveloppe 
5 cardiaque. Au jour 9,5. I'expression de lacZ dans le coeur augmente et 
est confinee au ventricule droit, aux arteres. 

Entre 12,5 et 15,5 jours une segregation du marquage en fonction 
des regions devient evident, le marquage etant confine au ventricule 
droit (figures 8A et SB). Les coupes montrent que I'expression a lieu 
10 dans le myocarde du ventricule droit, avec des marquages mineurs dans 
ie ventricule gauche et dans Tadrium droit (figure 9A). 

Cette expression dans le coeur est seulement transitoire, et 
n'apparait pas chez I'adulte. Elle est vraisemblablement inhtbee dans les 
phases tardives du developpement des foetus. L'expression precoce est 
15 aussi observee dans les segments du rostre a partir de 9,5 jours qui 
s'etend aux segments caudaux a 10,5 jours, et atteint des niveaux 
importants a 1 1 ,5 jours. 

L'expression diminue a partir de 12,5 jours dans les segments du 
rostre (figure SB) et finalement n'est plus detectable a 14,5 jours (figure 
20 10E). 

Les coupes montrent que l'expression du transgene est restreinte a 
la region myotomale des segments (figure 9 D). 

La plus grande partie de l'expression a lieu dans le systeme 
vasGulaire de I'embyron en developpement. A partir de 9,5 jours, 
25 I'expression est detectee dans I'aorte dorsale. A 10,5 jours, la coloration 
de I'aorte dorsale et des coudes aortiques augmente et a 11,5 jours, 
l'expression lacZ est clairement visible dans I'aorte dorsale. les coudes 
aortiques. les arteres iliaques, les arteres ombilicales, les arteres de la 
carotide et dans les vaisseaux majeurs de la tete. 

L'expression du transgene dans les vaisseaux augmente a partir de 
12,5 jours, date a laquelle les vaisseaux intercostaux peuvent etre 
facilement vus (Figure 8A). 

A 15.5 jours (figure 88), lacZ est present dans les vaisseaux 
majeurs, incluant ceux des membres et de la queue, et la coloration du 
--.^ tronc pulmonaire devient visible. L'expression dans le systeme 
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vasculaire persiste chez Padulte et est ctairement visible dans Faorte. 
dans le tronc pulmonaire et dans I'artere pulmonaire droite (figure 10A), 
ainsi que dans les vaisseaux des intestins (figure 10B), dans la vessie et 
dans I'uterus. 

5 Des coupes histologiques revelent mieux les differences dans 

I'expression du transgene dans les arteres et dans les veines. La section 
de I'embryon a 12,5 jours (figure 9A) montre un niveau d'expression tres 
elevee dans les couches musculaires des arteres de la carotide, de la 
quatrieme artere du coude de Taorte, du tronc pulmonaire proximal et de 

10 la partie proximale de I'aorte ascendante, tandis que les parties gauche 
et droite des veines cardinales anterieures restent non colorees. 
L'absence d'expression du transgene dans les veines musculaires 
ressort a ('evidence des coupes du ductus venosus, ainsi que des veines 
portales et ombilicales. La meme situation est observee chez I'adulte, ou 

15 I'expression ne peut jamais etre detectee dans les veines caves (figure 
10A) ni dans les veines pulmonaires. 

Ces observations mettent en evidence des differences qui 
n'avaient jusqu'alors pas ete mises en evidence entre les couches de 
muscles lisses des arteres et des veines. D'autres vues des arteres 

20 montrent que Texpression est restreinte a la couche de muscles et est 
absente de I'endothetium (figure 9C). 

II est de plus evident, au vu de I'ensemble des observations 
(figures BA, 8B), que I'expression du transgene est absente des muscles 
lisses des visceres. Ceci est inattendu, car te gene SM 22 endogene est 

25 suppose etre exprime dans les tissus musculaires lisses vasculaires et 
des visceres. Dans les coupes histologiques de la region abdominale 
d'embryon a 14,5 jours, les couches de muscles de Testomac, de 
rintestin et de la vessie en developpement sont facilement 
reconnaissables (figure 9C). L'expression du transgene dans cette 
region est clairement detectee dans les arteres ombilicales, mais pas 
dans les couches de muscles des visceres de I'estomac, du duodenum, 
de rintestin grele et du gros intestin, et de la vessie, ou aucune 
expression lacZ rfest observee. En outre, aucune expression n'est 
observee dans I'oesophage et dans la trachee (figure 9A), ainsi que 

?5 dans les bronches du poumon. 
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La coloration du tissu musculaire de Tadulte donne essentiellement 
les memes resultats. La figure 10B montre que Texpression du 
transgene est absente dans les muscles du colon, alors que le vaisseau 
mesentere est tres fortement colore par lacZ. Par centre, la coloration 
par immunofluorescence de la coupe d'une region intestinale similaire 
montre que la proteine SM 22 endogene est presente dans les deux 
tissus (figure IOC). L'absence d'expression du transgene dans les 
muscles lisses des visceres de I'adulte est de plus confirmee par des 
colorations de I'oesophage, de la tractiee. de la vessie, du canal 
deferent et de I'uterus pour I'activite figal. En aucun cas. il ne peut etre 
detectee une expression figal dans les couches musculaires de ces 



25 
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tissus. 



Cuneusement, une coloration importante est observee dans le 
cytoplasme des cellules epitheliales du lumen du canal deferent et dans 
I'epithelium des conduits renaux. Ceci est vraisemblablement dij a une 
activite galactosidase endogene, la coloration etant aussi visible dans 
les animaux non transgeniques temoins. 
EXEMPLE 4 : 

Fabrication d'une construction eomportant des r6qions 
reoulatrices du oene SM 22 et le aene cod f nt la thymidine kinase du 
virus de rheroes (SM 22 INT-TKK 

Le fragment HIV-LTR (-167. + 80) est delete du plasmide pLTR- 
TK par digestion Hind III dont les extremites sont rendues bout franc 
avec renzyme de Klenow, suivie d'une digestion Xho I. Le plasmide 
referme en inserant un linker contenant les sites Xhol en 5', les sites 
Hind III et Bsp 1201 dans I'ordre 5'->3' et une extremite 3' bout-franc pour 
donner le vecteur p-TK. Un fragment Bsp 1201/Hind III de 5.8 kb 
recouvrant la region -2125 a + 3648 du locus SM 22 est insere dans p- 
TK pour obtenir SM 22 INT-TK. Ce fragment est compris dans 
i'enchainement de nucleotides de la SEQ ID N'l . 

Cette construction est schematiquement representee sur la figure 

11. 

EXEMPLE 5 : 

Fabrication du Plasmide o44S niz p»rtant le fragment -445 a 
65duQeneSM22fusionneau iAn lacZ. et obtention d transqenes 
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Materiels et methodes 
Construction de p445ntz 

Le plasmide p2125nlz a ete coupe par Xba I qui a un site unique 
dans le « polylinker )> en 5' en amont de la sequence SM 22 . Les 
5 extremites 5' protudantes du fragment ont ete remplies a t'aide de la 
polymerase Klenow. par du dNTP. 

Apres precipitation le fragment a ete coupe par Pst I qui a un site 
unique en position -445 relativement au nucleotide +1 de debut de la 
transcription. 

10 Les extremites 3' protudantes de la coupure Pst I ont ete 

hydroiysees a la polymerase Klenow sans dNTP. Le fragment 
comprenant les sequences plasmidiques plus la sequence SM 22 de - 
445 a + 65 fusionnee au gene lacZ a ete purifie a partir d'un gel 
d'agarose et referme par la ligase T4, 

15 Pour les experiences de transgenese le fragment injecte dans les 

oeufs de souris a ete purifie a partir d'une double digestion Pst l/Nsi I du 
plasmide p2126nlz. 

Les resultats obtenus avec cette construction et ceux obtenus avec 
p2126 INTIacZ et p2126lacZ pour comparaison, figurent dans le tableau 

20 ci-apres. 

Les proprietes de regulation transcriptionnelle de la sequence- du 
gene SM 22 entre les nucleotides -445 et +65 ont ete analysees in vivo 
dans des souris transgeniques par deux methodes. La premiere 
methode appelee analyse transitoire consiste a analyser le patron 
25 d'expression du gene lacZ directement dans les embryons fondateurs 
FO a un stade donne. La deuxieme methode consiste a etablir des 
lignees stables a partir de fondateurs FO adultes. 
1. Analyse transitoire 

L'analyse transitoire a permis d'obtenir quatre embryons ayant 
30 integre le transgene p445nlz dans leur genome sur un total de 13 
embryons. Parmi les quatre embryons positifs analyses a 12^5 jours de 
developpement, un embryon n'exphmait pas le transgene. Deux 
embryons presentaient un patron d'expression identique a celui de la 
lignee p2126 INT niz au meme stade. c*est-a-dire specifique des cellules 
35 musculaires lisses arterielles. et enfin un troisieme embryon presentait 
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les memes territoires d'expression arterielle additionnes de divers sites 
d'expression ectopique essentiellement diffus dans le mesenchyme 
embryonnaire. 

2. Lianees stables 

Deux lignees stables independantes ont ete etablies a partir d'un 
male (lignee n°1) et d'une femeile (lignee n°9). 

L'expression du transgene a ete analysee dans I'embryon au stade 
15.5 jours pour la lignee 1 et 17,5 jours de developpement dans la 
lignee 9. Les deux lignees presentent le meme type d'expression dans 
les arteres: au niveau du coeur, le transgene est exprime dans I'aorte 
dorsale et le tronc pulmonaire arteriel. 

A la difference des lignees obtenues avec les transgenes 
p2126nlz et p2126 INTnlz. les deux lignees p445nl2 expriment lacZ tres 
fortement dans les parois de I'oesophage et de la trachee respiratoire 
15 qui sont composees de muscle lisse a ce stade. 

Les deux lignees presentent des differences entre elles dans 
certaines regions de I'embryon. Pour la lignee n'1, le transgene 
s'exprime fortement dans les bronchioles en continuite de la trachee a 
15,5 jours ce qui n'est pas observe dans la lignee n»9 a 17,5 jours ou 
lacZ n'est trouve que dans la trachee. Cette difference peut §tre due soit 
a une modification de la regulation due a des sites d'integralion 
differents dans les deux lignees, soit a la difference de stade qui fait que 
l'expression de lacZ peut etre reprimee entre le jour 15,5 et 17,5. 

Dans les deux lignees on trouve done une expression du transgene 
dans des organes qui contiennent une forte composante de cellules 
musculaires lisses. II est interessant de noter qu'il s'agit d'une partie au 
moins des cellules musculaires lisses de type respiratoire, la trachee, et 
une partie des cellules musculaires lisses de type visceral, I'oesophage. 

Enfin des sites d'expression ectopiques differents, c'est-a-dire ou la 
presence de la proteine ou de I'ARN SM 22 endogene n'a pas ete 
reportee, ont ete trouves dans les deux lignees. La lignee 1 presente 
entre autre une expression forte tres localisee dans les deux doigts 
posterieurs de chaque membre. La lignee 9 exprime fortement lacZ dans 
les regions anterieures du cerveau. 
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L'expression de cette construction a deux stades de revolution est 
illustree par les figures 12A a 12D qui representent des embryons de 
15.5 jours p.c. (12A, 12B, 12C) et un adulte de 2 mois (12 D) SM 445 niz 
colores pour I'activite (i-galactosidase. On note ['expression dans le tissu 

5 musculaire lisse des arteres, de I'oesophage et des bronches sur les 
figures 12A, B. C ainsi que dans des sites ectopiques comme la moelle 
epiniere (12B) ou les deux doigts posterieurs de chaque membre (12A). 
On note aussi I'absence d'expression dans Taorte thoracique ou le tronc 
pulmonaire arteriel chez I'adulte {12D). Seule une expression dans la 

10 trachee est maintenue. 

Les resultats obtenus montrent qu'une sequence de 450 paires de 
bases est suffisante pour garder la meme expression dans Tembryon et 
le foetus mais pas chez I'adulte. 
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TABLEAU 



Constructions 


N' de natssances 


Nomenclature 


Express/on 


Adutte 












SM 22 


6 








p21261NTIacZ 












22 


M9 










F23 


arteres. 


aorte, artere 










putmonaire 




17 


VI3 






p21261acZ 




i\yi4 


arteres 


aorte, artere pulmonaire 








ventrrcuie droit 


venlricule droit 






r »7 






SM445 


8 


nM 


artere+no sp 




p445lacZ 




n'6 


arteres seules 








n"? 








5 


nM 


arteres seules 






17 


M1 


artere+no sp 


pas d'expression 






F9 


artere + no sp 


pas d'expression 
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LISTE DE SEQUENCES 



) INFORMATIONS GENERALES : 

(i) DEPOSANT: 

(A) NOM: INSTITUT PASTEUR 

[b) RUE: 28 RUE DU DOCTEUR ROUX 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75015 

(A) NOM: UNIVERSITE PARIS 7 

(B) RUE: 1 PLACE JUSSIEU 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 7 5 005 

(ii) TITRE DS L' INVENTION: SEQUENCES EN A!-:GNT DU GENE SM22 
(iii) NOMBRE DE SEQUENCES : 5 

(iv) FORl-lE DECHIFFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D* EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: PatGntIn Release #1.0, Version #1.30 (OEB) 



INFORMATIONS POUR LA SEQ IDNO: 1 : 

(i) CARACTERJSTIQUES DE LA SEQUENCE: 

(A) LONGLTUR: 6261 paircs dc bases 

(B) TYPE : nuddoridt 

(C) NOMBRE DE BRINS : doub]t 

(D) CONFIGURATION : liaczirc 

(ii) TYPE DE MOLECULE : ADN (gcnomique) 

(iu) HYPOTHETIQUE : NON 

(vi) ORIGINE : 

(A) ORGANISME : SOURIS 
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30 

GG GCCCCAGGAA 

TGTGTTTCCT TCTCTCCACC ATGTTTTTAT AGCTCTTGGG 
CTGGGAGAAG AGGCGGGTCT 

GGGTCTTTGT TTCTGAGCTT TGTTCTATGT TCCTCCATGC 
TACGGTTGCA ATTGTTTTCT 

ATGAACGAGT ACATTCAATA .AAGACAACCA GACCTGGGAT 
TTGGGGTCTT ACTGATGTGT 

TGGGAGGTGC AGGAGCCTCC GTGTCCCATT TATTTTGGCC 
TTCCCGTCTC GTTTCTGTGC 

GTGGCTACAT TGGGAATGAC CTTCCTTGAT CCCACCAAGC 
CACCCATTGA TTCTGTAAAC 

ATGTGACCCT TGCTCCAAGC ATTGCTTACA GGAGCAGGAT 
ACTGAAAGTG TGTCTGTGCC 

CTCTCCTGAT AACCCCTCCC TTCAGCAGGC ACACAGCACC 
TGACTACCCA CCACGTATGT 

AAACGTCAGT ATCCTTTCCA GCCAGCTCTG CAGATGGGTG 
TCCAGGCTGT GCATGATGCA 

CCTCAAGTGG GCAGAGCTTG CAGGCCAAGG TTTTAAAGGC 
TGTTCAGGAA TGGATGGCAA 

GCAGGATCTA AGAGGAGGGG GGGTTGTTGT TGTTTGGGGG 
GGGGGTGGTT TTGGTTTGTT 

TTTTTTGAGA CAGGGTTTCT CTGTGTGGCC CTGGCCCTCC 
TGGAACCCAC TCTGTAGACC 

AGGCTGGCCT TGAACTCAGA AATCTGCCTG CCTCTGCCTC 
CCGAGTGCTG GGATTAAAGG 

CGTGTGCCCA TCGAGGAGGG AGATTTTATT TAGATTATAA 
AAAGGACGGG ATTTGGGGAA 

TCCTGTCTAG TGAATTCAGG ACGTAATCAG TGGCTGGGAA 
GCAAGAGCTC TAGAGGAGCT 

CCAGCTTATT ATGACCCTTC CTTCAGATGC CACAAGGAGG 
TGCTGGAGTT CTATGCACCA 

ATAGCTTAAA CCAGCCAGGG TGGCTGTAGT GGATTGAGCG 
TCTGAGGCTG CACCTCTCTG 

GCCTGCAGCC AGTTCTGGGT GAGACTGACC CTGCCTGAGG 
GTTCTCTCCT TCCCTCTCTC 

TACTCCTTCC TCCCTCTCCC TCTCCCTCTC TCTGTTTCCT GAGGTTTCCA 
GAATTGGGGA 

TGGGACTCAG AGACACCACT AAAGCCTTAC CTTTTAAGAA 
GTTGCATTCA GTGAGTGTGT 

GAGACATAGC ACAGATAGGG GCAGAGGAGA GCTGGTTCTG 
TCTCCACTGT GTTTGGTCTT 

GGGTACTGAA CTCAGACCAT CAGGTGTGAT AGCAGTTGTC 
TTTAACCCTA ACCCTGAGCC 

TGTCTCACCT GTCCCTTCCC .AAGACCACTG AAGCTAGGTG 
CAAGATAAGT GGGGACCCTT 

TCTGAGGTGG TAGGATCTTT CACGATAAGG ACTATTTTGA 
AGGGAGGGAG GGTGACACTG 

TCCTAGTCCT CTTACCCTAG TGTCTCCAGC CTTGCCAGGC 
CTTAAACATC CGCCCATTGT 

CACCGCTCTA GAAGGGGCCA CCCTTGACTT GCTGCT.AAAC 
AAGGCACTCC CTAGAG,\AGA 
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GTCCACTGTA GGCAGATAGG TGACAGGTGG CAGATAGGTG 
ACAGATAGGT GACAGGTGGA 

GGAGCTTTGG AACTGGGACT GGACAGCCCT GGGACCCTGT 
TCCTCCCAAA GGGTCTTGGT 

GGTTCCCCTT GGGGCTCTCT .AAAGGATGTC AGTGGGCTGT 
TGCCACATCT ATATAAGAGG 

ACTAGTCTTC TGGAATTTAG GTGTGATCTC TCAGGGATGC 
AGAAATGCTC ACCCTTACTG 

TCATTTTATG GGCTGAGGTA CCACAGGCAG ATATACCCTG 
GTCTGCTTGT TGTCCAGGGT 

CTCTGCTACA TGGAGGCCCC TTTCCACAGC CTAACCTCTC 
TACCTGCTGA CAGGAGGGCT 

GGATGGCCAC AGGCATCCAA CGTGCGCATC ATGCAGGTGT 
TTTGCGTTGG AGCTTTTGTC 

TAGAAATACC CTGGTGGGCT GCCAAACCAC CACCCATATC 
CCTCTCTCCT CTCTGCTGCC 

TCTA AGATGA CAGCTTGATT TTTCTTATAG TGATTTTTTT TTTTGGTTTT 
GTTTTTTTGT 

TTGTTTTAAG TTAGCATACA AAGTAATACA TTTCATCATG 
GCATTTGGAC ATACATATAT 

ATTTTATTTG CTCTCCTGGC CTCTTCTCAA AGAGACTTCT CTGGACTTTC 
TTGTATTTTT 

GGTTGTGAGC CTAGCCTTTA ACGGCTGAGC CATCTCTCCA 
GCCCTTCTTT GGACTTTCTA 

CTTCATACTT CCCACCAGTC TGGGAAGAAG GGCACATGGA 
ATCTTGAGAG CATGACCTGA 

CCCAGACCTG ACAGATGTCA AGGCTGCAGT GTATGCTCTT 
GTTCGTACGG CTTGTTCTTA 

GTCCTGCAGT TCAGAACTTT CTGGAGACTG AGAAGTGCAT 
GTGAGGACAC TCTCCTCCCA 

TCTTTTCCTC TAGTGGCTAG TGATGTTTGG TTTTTTGTTT 
TGAGACAGGG TTTCTCTGTA 

TAGCCCTAGC TATCCTGGAA CTCACTTTGT AGATCAGGCT 
GGCCTCCAAC TCAGAAATCT 

GCCTGCCTCT GCCTCCCGAG TGCTGGGACT AAAGGCGTGC 
GCCACCACTG TCCAGTCAGG 

AGTAGAAGGA AACTGTAAGG TGCTTGAGAC AGGCTGAGTA 
GAGGCTAGGA GGAAGGGGCA 

CCGCAGTCAC CGGCTCCATG ACTCTGTGAC TTTTGTGGTT 
CCTTGTCGCA GCGGTTCCTG 

GTGGTGGTGG TGGTCGGGGG TTGGGGGGAG GGGGCAGGCC 
ACACAGTGGG GTGTGGGAGG 

GAATAGCTGT TGACAACTTC CCAACAGAAA CCAGGCTTTT 
GAGTCCTCCA GGGTAGCTTG 

AGAGGGTACT CAGAAAGCCG TGTCCATGTC CCCTTTCCTT 
CACCTCAGGG AAGTAAGTTG 

CCTATAGGGT TGTCATTTCA ATGAGGTCTT CTGGTTATTC TGTTTTTCTC 
TCAATGTTGG 

TGTTGGGCTC AGGGA,.\TGCT TTGGAGAAGG TGGTGGGAAC 
TGGAGAAGGG .AAGATCAGTT 
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TACCATACCT GTGGGCAGGA TGACCCATGT TCTGCCATGC 
ACTTGGTAGC CTTGGAAAGG 

CCACTTTGAA CCTCAATTTT CTCAACTGTT AAATGCAGTG 
GTAACTGCTA TCTCATAATA 

AAGGGGAACG TGAGGAAGGC GTTTGGATAG TGCCTGGTTG 
CGGCCAGGCT GCAGTCAAGA 

CTAGTTCCCA CCAACTCGAT TTTAAAGCCT TGCAAGAAGG 
TGGCTTGTTT GTCCCTTGCA 

GGTTCCTTTG CTCGGGCCAA ACTCTAG,\.\T GCCTCCCCCT 
TTCTTTCTCA TTGAAGAGCA 

GACCCAAGTC CGGGTAACA.\ GGAAGGGTTT CAGGGTCCTG 
CCCATAAAAG GTTTTTCCCG 

GCCGCCCTCA GCACCGCCCC GCCCCGACCC CCGCAGCATC 
TCCAAAGCAT GCAGAGAATG 

TCTCCGGCTG CCCCCGACAG ACTGCTCCAA CTTGGTGTCT 
TTCCCCAAAT ATGGAGCCTG 

TGTGGAGTGA GTGGGGCGGC CCGGGGTGGT GAGCCAAGCA 
GACTTCCATG GGCAGGGAGG 

GGCGCCACGG GGCG<3CAGAG GGGTGACATC ACTGCCTAGG 
CGGCCTTTAA ACCCCTCACC 

CAGCCG<}CGC CCCGGCCCGT CTGCCCCAGC CCAGACACCG 
AAGCTACTCT CCTTCCAGTC 

CACAAACGAC CAAGCCTTGT AAGTGCAAGT CATGGGAGCA 
GAAGGGCTGT GGGCTCAATT 

AGATCCCCTA GTCTCTTCTA GTTTGCTGGG TGGAATTGGG 
TCCCTAGAGA CCATTCTCTG 

TGTTAGACAA AAAGTCTGGG TTAAAATGCC TAGGATGATT 
TGACTGGGOC AAAAGAATAA 

ATGGGGTGAG AGGGAGGCTC AA.^TTCAGTC ACTGTCCCAC 
CCATAGGTGT ATGGGCTATG 

TGTTAGGCCC AAAGAGGTGA C.\AATGAGGC CAAGGGAACA 
ACTCCATCTT TGGATCTCCA 

AGAAGGTGAG GGGCT.\.AGTT CTGGAAAGCA GTGACCCACT 
GATGGTCCCC AGGGCTAATG 

CAACTCGGGG GAGCCAGGAG GTAGCCCCCT CAGGCAGTGG 
AGGACTAAAG ATCTTATTTT 

TTGTAGCGCT AGGGATCAAA CCCCAGGGCG CTATGTGTGG 
CAGGCATGTG CTCCATCTAC 

CACAGAAGTT TAATCCTTCA GACTAGCCTG GGATAGGGCC 
TGCTTTTTCT TTCCTTTTCT ^xr-Txr 
CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCTCi 1 i 

CTTTCCTTTT 

CTCTCTTTCA CTCTCTCTTT CT.A-MTTCTT TTTCTTTTTT TCTTTCTTTT 
CTTTAGACAG 

GGTTTCTCTG TGTAGCCCTG GCTGTTCTGG AACTCACTCT 
TTAGACCAGG CTGGCCTCGA 

ATCTCAGAAA TCTACCTGCC TCTGCCTCCC .i^^GTGCTGGG 
ATTAAAGGCG TGTGCCACCA 

CTGCCCAGCT AAGGTTTGCT TTTTGATGGC AGCTTGGTCC 
AGTTTGAA.AG TAGGAGGTCA 
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TACTGTGTAA ACTCACTGGT T.\AAGTACCC CCTCCCTTCC 
ACCCTGCAAT ACACACACAC 

ACACACACAC ACACACACAC ACACACACAC ACCCCATCTC 
GAAGAGCTCT ATTAAGCTCC 

AGGTGCACTG TAGTTCACAG ACTGCATCTT CCAGGTTTGC 
TCCCACTTCA C.A-AGCAGAGA 

ACTCATAACT GAAGGGGGTG ACAGCACAGG G<}AAGGGA,-V.-\ 
GCAAGATGTT TAGAGTCTGA 

CAGCTGGCCC GGGACCAGAG CCATGTGGTA ATGTTTGCTC 
CACTCCCATC CACCTCCACG 

GCTGTGATGT GGAGAAGGTC CCCGCTTTCA TGGGAAGGAG 
GTGGGGGAGC CTGTCATCTG 

CTCCATGCTC ACACAATTTT TCTCTCAACC AATGACCTCT 
CAGAAGCAGG GGTTGGTTTG 

CAAAATTCTT CAGATACCTC AACAGATGGC ATCCCACTCA 
GGCTATCCCT GCTGACTAGG 

TCTGGCTCCA GCCCTGACTG TATCTACCCA G<}GACCTACC 
TGCCTGCTTT GCTCCTATAG 

CCTTCCTCCG TGTCTGGGTC CCCAGAGAGC TGCCGOCATA 
GGCCTTTGAG GC.AACAGCTG 

GCATACAGGC CAGGCTTCCC ATGCTCTGGC TAGCAGATTC 
TCTGCCCTGG AGGACTTTGA 

CTGCATGGTT TCTCTCACTG CTGCAACAGT CAGAGCTGGC 
CCACACGGGC ACAACAGCGC 

ACTTCCATCT GGGTCTCCCT GAGAATGCCG CTGTTTTCTG 
AGAACCCTTG GACTCTGGTG 

GCTTTATCAG GTCTTTTTGT CAGCTGCGCT TTGGGGGATG 
AACTTTGCTC TTCTGGCTTC 

TGGGTCAGAG GGTAAAGATT TGGTGGCAAC CGGTAGCTAG 
AGAAAGATAG CTACTGGCTG 

AATTTGGAGG ACATGGCTTC TGGAA.AACCT CTCTAGTGGT 

tttctggcta gtcttggcaa 

agtaaaaatg ctctgatagc cac-cccgggt gatgcagggc 
ttcctgttcg aggcctttct 

gtacaaaatt agtgagacat tgcctc.aaaa ctatgaa.aca 
agccagactc tgttgaagca 

cgcctttaat cccagcactc aggaggctga agcaggcaag 
atctctgtta gttggaggcc 

agtctacagg aaagttctac aacagcagag gccagacagt 
gcaacccttt ctgggggtgt 

gggggaggaa aacccaac.a.a a.aacacaaac tataaaacaa 
agagaaggcc gaggacaaag 

cttagcaatg catacttccc tttctatgtg aagccctggg 
ctccaccagt actgcagaaa 

gaagcaagca atgagggaca ggaggttggc tctaggccca 
ggggttgtca aaatagtcca 

caggccaaag gcagcctgat gtctgttttt ataaacaaaa 
ttttattg<k: acacattggt 

TATGTATCAG CTAGGCTATT TTCATTACAA TAGAGGCCAT 
ATGGTCTGTA .\.AGTCTA.A.A.A 
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TATTTACTCT GCTGTTTTAC ATAAAAAGTT GACAGACTCT 
TGCTCTAGAC TGACAAATAT 

CTAAGACCTT GTTTTCTGAG GTTCAAGTTT CAGAGGGGTC 
TCTGCAGCAA GTGGGTAAAG 

CTGGTCTAGG TCATGCTATG ATGTCTAGGG TCCCCTCAGA 
GTGGAAGGCC TGCTTAGCAC 

AAATGAAGTA AAGTAACTTG CTGGCTCTTT GTTCTTTTCT 
CCACACTCTA TACTTTAGCT 

CTGCCTC 
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(2) INFORI'lATIONS POUR LA SEQ ID NO: g: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2190 paires de bases 

(B) TYPE: nucleotide 

(C) NDMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE: NON 

(vi) ORIGINS: 

(A) ORGANISME: SOURIS 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2 : 
GGGCCCCAGG AATGTGTTTC CTTCTCTCCA CCATGTTTTT ATAGCTCTTG GGCTGGGAGA 
AGAGGCGGGT CTGGGTCTTT GTTTCTGAGC TTTGTTCTAT GTTCCTCCAT GCTACGGTTG 
CAATTGTTTT CTATGAACGA GTACATTCAA TAAAGACAAC CAGACCTGGG ATTTGGGGTC 
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TTACTGATGT GTTGGGAGGT GCAGGAGCCT CCGTGTCCCA TTTATTTTGG CCTTCCCGTC 2- 
TCGTTTCTGT GCGTGGCTAC ATTGGGAATG ACCTTCCTTG ATCCCACCAA GCCACCCATT 3( 
GATTCTGTAA ACATGTGACC CTTGCTCCAA GCATTGCTTA CAGGAGCAGG ATACTGAAAG 3t 
TGTGTCTGTG CCCTCTCCTG ATAACCCCTC CCTTCAGCAG GCACACAGCA CCTGACTACC 
CACCACGTAT GTAAACGTCA GTATCCTTTC CAGCCAGCTC TGCAGATGGG TGTCCAGGCT 
GTGCATGATG CACCTCAAGT GGGCAGAGCT TGCAGGCCAA GGTTTTAAAG GCTGTTCAGG 
AATGGATGGC AAGCAGGATC TAAGAGGAGG GGGGGTTGTT GTTGTTTGGG GGGGGGGTGG 
TTTTGGTTTG TTTTTTTTGA GACAGGGTTT CTCTGTGTGG CCCTGGCCCT CCTGGAACCC 6i 
ACTCTGTAGA CCAGGCTGGC CTTGAACTCA GAAATCTGCC TGCCTCTGCC TCCCGAGTGC 
TGGGATTAAA GGCGTGTGCC CATCGAGGAG GGAGATTTTA TTTAGATTAT AAAAAGGACG 
GGATTTGGGG AATCCTGTCT AGTGAATTCA GGACGTAATC AGTGGCTGGG AAGCAAGAGC 
TCTAGAGGAG CTCCAGCTTA TTATGACCCT TCCTTCAGAT GCCACAAGGA GGTGCTGGAG 
TTCTATGCAC CAATAGCTTA AACCAGCCAG GCTGGCTGTA GTGGATTGAG CGTCTGAGGC 
TGCACCTCTC TGGCCTGCAG CCAGTTCTGG GTGAGACTGA CCCTGCCTGA GGGTTCTCTC 
CTTCCCTCTC TCTACTCCTT CCTCCCTCTC CCTCTCCCTC TCTCTGTTTC CTGAGGTTTC 
CAGAATTGGG GATGGGACTC AGAGACACCA CTAAAGCCTT ACCTTTTAAG AAGTTGCATT 
CAGTGAGTGT GTGAGACATA GCACAGATAG GGGCAGAGGA GAGCTGGTTC TGTCTCCACT 
GTGTTTGGTC TTGGGTACTG AACTCAGACC ATCAGGTGTG ATAGCAGTTG TCTTTAACCC 
TAACCCTGAG CCTGTCTCAC CTGTCCCTTC CCAAGACCAC TGAAGCTAGG TGCAAGATAA 
GTGGGGACCC TTTCTGAGGT GGTAGGATCT TTCACGATAA GGACTATTTT GAAGGGAGGG 
AGGGTGACAC TGTCCTAGTC CTCTTACCCT AGTGTCTCCA GCCTTGCCAG GCCTTAAACA 
TCCGCCCATT GTCACCGCTC TAGAAGGGGC CACCCTTGAC TTGCTGCTAA ACAAGGCACT 
CCCTAGAGAA GATACCATAC CTGTGGGCAG GATGACCCAT GTTCTGCCAT GCACTTGGTA 
GCCTTGGAAA GGCCACTTTG AACCTCAATT TTCTCAACTG TTAAATGGAG 7GGTAACTGC 
TATCTCATAA TAAAGGGGAA CGTGAGGAAG GCGTTTGGAT AGTGCCTGGT TGCGGCCAGG 
CTGCAGTCAA GACTAGTTCC CACCAACTCG ATTTTAAAGC CTTGCAAGAA GGTGGCTTGT 



4: 

5-: 

5( 



7: 

7£ 
8*: 
9C 
9£ 

lo: 

10£ 
114 
12C 

i2e 

132 
13E 
144 
15C 
156 
152 
158 
174 
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: 7 



TTGTCCCTTG 


CAGGTTCCTT 


TGCTCGGGCC 


AAACTCTAGA 


ATGCCTCCCC 


CTTTCTTTCT 


18i 


CATTGAAbAb 


L AoAl^LL-AAo 






TTCAGGGTCC 


TGCCCATAAA 


18f 


AGGTTTTTCC 


CGGCCGCCCT 


CAGCACCGCC 


CCGCCCCGAC 


CCCCGCAGCA 


TCTCCAAAGC 


19: 


ATGCAGAGAA 


TGTCTCCGGC 


TGCCCCCGAC 


AGACTGCTCC 


AACTTGGTGT 


CTTTCCCCAA 


19; 


ATATGGAGCC 


TGTGTGGAGT 


GAGTGGGGCG 


GCCCGGGGTG 


GTGAGCCAAG 


CAGACTTCCA 


20. 


TGGGCAGGGA 


GGGGCGCCAC 


GGGGCGGCAG 


AGGGGTGACA 


TCACTGCCTA 


GGCGGCCTTT 


21( 


AAACCCCTCA 


CCCAGCCGGC 


GCCCCGGCCC 


GTCTGCCCCA 


GCCCAGACAC 


CGAAGCTACT 


21. 


CTCCTTCCAG 


TCCACAAACG 


ACCAAGCCTT 








21! 
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(2) INFORl-lATIONS POUR LA SEQ ID NO: 3 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: -1551 paires de bases 

(B) TYPE: nucleotidtT 

(C) NOMBRE DE BRINS: doubl? 

(D) CONFIGURATION: line aire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(iii) HYPOTHETIQUE: NON 

(vi) ORIGINE: 

(A) ORGANISME: S0URI3 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3 

GGGCCCCAGG AATGTGTTTC CTTCTCTCCA CCATGTTTTT ATAGCTCTTG GGCTGGGAGA 

AGAGGCGGGT CTGGGTCTTT GTTTCTGAGC TTTGTTCTAT GTTCCTCCAT GCTACGGTTG 

CAATTGTTTT CTATGAACGA GTACATTCAA TAAAGACAJVC CAGACCTGGG ATTTGGGGTC 
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TTACTGATGT 


G7TGGGAGGT 


GCAGGAGCCT 


CCGTGTCCCA 


TTTATTTTGG 


CCTTCCCGTC 


2 


TCGTTTCTGT 


GCGTGGCTAC 


ATTGGGAATG 


ACCTTCCTTG 


ATCCCACCAA 


GCCACCCATT 


3 


GATTCTGTAA 


ACATGTGACC 


CTTGCTCCAA 


GCATTGCTTA 


CAGGAGCAGG 


ATACTGAAAG 


3 


TGTGTCTGTG 


CCCTCTCCTG 


ATAACCCCTC 


CCTTCAGCAG 


GCACACAGCA 


CCTGACTACC 


4 


CACCACGTAT 


GTAAACGTCA 


GTATCCTTTC 


CAGCCAGCTC 


TGCAGATGGG 


TGTCCAGGCT 


4 


GTGCATGATG 


CACCTCAAGT 


GGGCAGAGCT 


TGCAGGCCAA 


GGTTTTAAAG 


GCTGTTCAGG 


5 


AATGGATGGC 


AAGCAGGATC 


TAAGAGGAGG 


GGGGGTTGTT 


GTTGTTTGGG 


GGGGGGGTGG 


6 


TTTTGGTTTG 


TTTTTTTTGA 


GACAGGGTTT 


CTCTGTGTGG 


CCCTGGCCCT 


CCTGGAACCC 


6 


ACTCTGTAGA 


CCAGGCTGGC 


CTTGAACTCA 


GAAATCTGCC 


TGCCTCTGCC 


TCCCGAGTGC 


7 


TGGGATTAAA 


GGCGTGTGCC 


CATCGAGGAG 


GGAGATTTTA 


TTTAGATTAT 


AAAAAGGACG 


7 


GGATTTGGGG 


AATCCTGTCT 


AGTGAATTCA 


GGACGTAATC 


AGTGGCTGGG 


AAGCAAGAGC 


8 


TCTAGAGGAG 


CTCCAGCTTA 


TTATGACCCT 


TCCTTCAGAT 


GCCACAAGGA 


GGTGCTGGAG 


9 


TTCTATGCAC 


CAATAGCTTA 


AACCAGCCAG 


GCTGGCTGTA 


GTGGATTGAG 


CGTCTGAGGC 


9' 


TGCACCTCTC 


TGGCCTGCAG 


CCAGTTCTGG 


GTGAGACTGA 


CCCTGCCTGA 


GGGTTCTCTC 


10; 


CTTCCCTCTC 


TCTACTCCTT 


CCTCCCTCTC 


CCTCTCCCTC 


TCTCTGTTTC 


CTGAGGTTTC 


10 


CAGAATTGGG 


GATGGGACTC 


AGAGACACCA 


CTAAAGCCTT 


ACCTTTTAAG 


AAGTTGCATT 


11- 


CAGTGAGTGT 


GTGAGACATA 


GCACAGATAG 


GGGCAGAGGA 


GAGCTGGTTC 


TGTCTCCACT 


12 


GTGTTTGGTC 


TTGGGTACTG 


AACTCAGACC 


ATCAGGTGTG 


ATAGCAGTTG 


TCTTTAACCC 


12 


TAACCCTGAG 


CCTGTCTCAC 


CTGTCCCTTC 


CCAAGACCAC 


TGAAGCTAGG 


TGCAAGATAA 


13. 


GTGGGGACCC 


TTTCTGAGGT 


GGTAGGATCT 


TTCACGATAA 


GGACTATTTT 


GAAGGGAGGG 


13: 


AGGGTGACAC 


TGTCCTAGTC 


CTCTTACCCT 


AGTGTCTCCA 


GCCTTGCCAG 


GCCTTAAACA 


14- 


TCCGCCCATT 


GTCACCGCTC 


TAGAAGGGGC 


CACCCTTGAC 


TTGCTGCTAA 


ACAAGGCACT 


15t 


CCCTAGAGAA 


GATACCATAC 


CTGTGGGCAG 


GATGACCCAT 


GTTCTGCCAT 


GCACTTGGTA 


15( 


GCCTTGGAAA 


GGCCACTTTG 


AACCTCAATT 


TTCTCAACTG 


TTAAATGGAG 


TGGTAACTGC 


16: 


TATCTCATAA 


TAAAGGGGAA 


CGTGAGGAAG 


GCGTTTGGAT 


AGTGCCTGGT 


TGCGGCCAGG 


161 
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INFORMATIONS POUR LA SEQ ID NO: 4 

(i) CARACTEWSTIQUES DELASEQUENCE: 

(A) LONGUEUR: . paires dc bases 

(B) TYPE : nuddoride 

(C) NOMBRE DE BRINS : double 

(D) CONFIGXmATlON : liasaire 

(u) TYPE DE MOLECULE : ADN (swomiqus) 

(iii) HYTOTHETIQUE : NON 

(vi) ORIGINE : ^^^^^c 
(A) ORGAKISME : SOUWS 



FEUILLE RECTIFIEE (REGLE 91) 
ISA/EP 
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TCTAGAGGCC ACGGAACGGT GCCAAGCACA CAGTCCCTTT TGCCTCTTTC 

ACGGGAGCAG ^ . » Ar-rr AfiS AACATGCCAG GTCCCTGTGT 

GAGTCCCAGT GCCTGTCGTG GAAAGGGAGG AACAI i^^-^ 

^■^^^J'tc^cacc aaaggactca gggctggttt ctgagtttcc gtccagtatt 

'^?5i?S??AGT CACGTAGGCC TAAGAGCCTT GGCGTTTACA GAGTCACCCA 
°^SgIca??CT GGTCCTTGGC G-rrrACAGAG TCACCCAGCT CCAGGCCCCT 
GGCACTTTGG ^ CCCTTCACTC CACCAGGTCC ATTCCAGATG CCAAGAGTGG 
^^?G^^^S^iT TCTCTCCACC ATGTTTTTAT AGCTCTTGGG CTGGGAGAAG 
^°GGG?cmGTTTCTGAGCTTTGnCTATGTTCCT^^^^ 
^^A?SLg\gT ACAITCAATA AAGACAACCA GACC^^ 

'^^^GgLa'^JtGC AGGAGCCTCC GTGTCCCATT TATrTTGGCC TTCCCGTCTC 

^^t^SJtacat tgggaatgac cttccttgat cccaccaagc cacccattga 
^ atIt^ccct tgctccaagc attgcttaca ggagcaggat actgaaagtg 

'°CTC?J??§AT AACCCCTCCC TTCAGCAGGC ACACAGCACC TGACTACCCA 

^^JgtcIgt atcctttcca gccagctctg cagatgggtg tccaggctgt 

""""S^S^GIGG GCAGAGCTTG CAGGCC/^GG TnTAAAGGC TGTTCAGGAA 

TGQATGGCAA _^ r-rrTrrTTGT TGTTTGGGGG GGGGGTGGTT 

GCAGGATCTA AGA6GAGGGG GGGTTGTTGT Tt.ni 

CAGGGTTTCT CTGTGTGGCC CTGGCCCTCC TGGAACCCAC 
'""IlGCrGGC TGAACTCAGA AATCTGCCTG CCTCTGCCTC CCGAGTGCTG 
°^^J^^GCCCA TCGAGGAGCG AGATTTTATT TAGATTATAA AAAGGACGGG 
^TCC?§?^?AG TGAATTCAGG ACGtAATCAG TGGCTGGGAA GCAAGAGCTC 
■'''?c5gc??Ztt ATGACCCTTC CTTCAGATGC CACAAGGAGG TGCTGGAGTT 
^'AT?GC??^kA CCAGCCAGGC TGGCTGTAGT GGATTGAGCG TCTGAGGCTG 
^SfcScC AGTTCTGGGT GAGACTGACC CTGCCTGAGG GTTCTCTCCT 
TCCCTCTCTC^^ TCCCTCTCCC TCTCCCTCTC TCTGTTTCCT GAGGTTTCCA 
^^JSaS?cag AGACACCACT AAAGCCTTAC CTTTTAAGAA GTTGCATTCA 
°'^S?I?Igc ACAGATAGGG gcagaggaga gctggttctg tctccactgt 

^TgGTAcVgAA CTCAGACCAT CA6GTGTGAT AGCAGTTGTC TTTAACCCTA 
GTCCCTTCCC AAGACCACTG AAGCTAGGTG CAAGATAAGT 

""^^S^g^gSgq TAGGATCTTT CACGATAAGG ACTATTTTGA AGGGAGGGAG 

r:nTGACACTG 
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TCCTAGTCCT CTTACCCTAG TGTC7CCAGC CTTGCCA6GC CTTAAACATC 
"caccS?Jta GAAGGGGCCA CCCTTGACTT GCTGCTAAAC AAGGCACTCC 
""^rtS^A^CT gtgggcagga tgacccatgt tctgccatgc acttggtagc 

""I^^GP^A CCTCAAmr CTCAACTGTT AAATGGAGTG GTAACTGCTA 
'""McL'^GiACG TGAGGAAGGC GTTTGGATAG TGCCTGGTTG cggccaggct 
^"^CTA^ffcCCA CCAACTCGAT TTTAAAGCCT TGCAAGAAGG TGGCTTGTTT 

^Ig^^^tg CTCGGGCCAA actctagaat gcctccccct ttctttctca 
'^%Tcccj1%ic cgggtaacaa ggaagggttt cagggtcctg cccataaaag 

""SSJCCCTCA GCACCGCCCC GCCCCGACCC CCGCAGCATC TCCAAAGCAT 
•"^tCTC^jCTG CCCCCGACAG actgctccaa cttggtgtct ttccccaaat 
^'?§?§§S?GA gtggggcggc ccggggtggt gagccaagca gacttccatg 

°°S?G§cf ?GG GGCGGCAGAG GGGTGACATC ACTGCCTAGG CGGCC7TTAA 
. ''^S^CCGGCGC CCCGGCCCGT CTGCCCCAGC CCAGACACCG AAGCTACTCT 
^^S^J^C CAAGCCTTGT AAGTGCAAGT CATGGGAGCA GAAGGGCTGT 
°°^t^Sta GTCTCTTCTA GTTTGCTGGG TGGAATTGGG TCCCTAGAGA 
^^S5S?AA AAAGTCTGGG TTAAAATGCC TAGGATGATT TGACTGGGGC 
"^^Jifi^O AGGGAGGCTC AAATTCAGTC ACTGTCCCAC CCATAGGTGT 
'^^?g?5^G§CC AAAGAGGTGA CAAATGAGGC CAAGGGAACA ACTCCATCTT 

"^^gISS^ag gggctaagtt ctggaaagca gtgacccact gatggtcccc 
''''§2St'^gSgg gagccaggag gtagccccct caggcagtgg aggactaaag 

ATCT^XS?GCT AGGGATCAAA CCCCAGGGCG CTATGTGTGG CAGGCATGTG 
''"S/S.GTTTAATCCTTCAGACTAGCCTG GGATAGGGCC TGCTTmCT 

C^5??rCTCT CTCTCTCTCT CTCTCTGTCT CTCTCTCTCT CTCTCTCTTT 

CTTTCCl I IT ■ , , I TrrrTCTTTT CTTTAGACAG 

CTCTCTTTCA CTCTCTCTTT CTAATTTCTT ^JTCTTTm T^^ 
GGTTTCTCTG TGTAGCCCTG GCTGTTCTGG AACTCACTCT TTAGACU^ov, 
CTGGCCTCGA ; AAGTGCTGGG ATTAAAGGCG 



ATCTCAGAAATCTACCTGCC TCTGCCTCCC , 

rrGCCACCA 

CTGCCCAGCT AAGGTTTGCT TTTTGATGGC < 



TGTGCCACCA ; aGCTTGGTCC AGTTTGAAAG 



^'^Stccactgta GGCAGATAGG tgacaggtgg cagataggtg ACAGATAGGT 
^^gagI^^gg aactgggact ggacagccct gggaccctgt tcctcccaaa 
gggtcttggt 
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GOTTCCCCrr ggggctctct aaaggatgtc agtgggctot tgccacatct 
"l^^tnc tggaat^ag gtgtgatctc tcagggatgc agaaatgctc 

*"§™GGGCTGAGGTACCACAGGCAGATATACCCTGGTCTGCnGT 
'°i?CT§CTACA TGGAGGCCCC TTTCCACAGC CTAACCTCTC TACCTGCTGA 
"?^?gIc«C AGGCATCCAA CGTGCGCATC ATGCAGGTGT TTTGCGrrOG 
*°?;S5SScC CTGGTGGGCT GCCAAACCAC CACCCATATC CCTCTCTCCT 

CTCTGCTGCC „„._™-^T-iTAr- TGATTTTTTT TrrTGGTTTT GTTTTTTrGT 

TCTAAGATGACAGCTTGAlTTTTCTTATAGTCAllM^^ 

TTGTTTTAAG TTAGCATACA AAGTAATACA TTTCATCA 
"IS^l^O CTCTCCTGGC CTCTTCTCAA AGAGACTTCT CTGGACTTTC 
™^^SSSagc CTAGCCTTTA ACGGCTGAGC CATCTCTCCA GCCCTTCTTT 

""^S^ISIJtt cccaccagtc tgggaagaag ggcacatgga atcttgagag 

^%^^C%rO ACAGATGTCA AGGCTGCAGT GTATGCTCTT GTTCGTACGG 
'^G^SS^CAGT TCAGAAC7TT GTGGAGACTG AGAAGTGCAT GTGAGGACAG 
'°\fy^^C TAGTGGCTAG TGATGTTTGG TTTTTTGTtr TGAGACAGGG 
"'tSc'SJiS.gc TATCCTGGAA CTCACTTTGT AGATCAGGCT OGCCTCCAAC 
™^CCTCT GCCTCCCGAG TGCTGGGACT AAAGGCGTGO GCCACCACTG 
™SS?Ili?SGAAACTGTAAGGTGCTrGACA0AGGCTGA6TAGAGGCT.GGA 

■"^^^GC^Sr^AC CGGCTCGATG ACTCTGTGAG TTTrGTGGTT CCTTGTCGCA 
'='=Sg?gg -ggtcggggg TTGGGGGGAG GGGGCAGGCC ACACAGTGGG 

GTGTGGGAGG » * rrArr;rTTTT GAGTCCTCCA 

GAATAGCTGT TGACAACTTC CCAA.CAGAAA CCAGGCTl 1 

GGGTAGCTTG ^r-rr-n,,rnrr rrrTTTCCTT CACCTCAGGG 

AGAGGGTACT CAGAAAGCCG TGTCCATGTC CCCrr I ' 

^SwSSgT TGTCATTTCA ATGAGGTCrr CTGGTTATTC TGTTTTTCTC 

'^?S??GGCTC AGGGAATGCT TTGGAGAAGG TGGTGGGAAC TGGAGAAGGG 

^??Sg?Saa ACTCACTGGT TAAAGTACCC CCTCCCTTCC ACCCTGCAAT 

^^A^gJcA^C ACACACACAC ACACACACAC ACCCCATCTC GAAGAGCTCT 

""^agStocactg tagttcacag actgcatctt ccaggtttgc TCCCACTTCA 

'^CTCAWCT GAAGGGGGTG ACAGCACAGG GGAAGGGAAA GCAAGATGTT 

''?agctggccc gggaccagag ccatgtggta atgtttgctc cactcccatc 

CACCTCCACG „^^^oa Tz-rrAAfiGAG GTGGGGGAGC 

gctgtgatgt ggagaaggtc cccgctttca TGGGAAGGAG ^ 

CTGTCATCTG 
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CTCCATGCTC ACACAATTTT TCTCTCAACC AATGACCTCT CAGAAGCAGG 
^°S22^^cVcAGATACCTCAACAGATGGCATCCCACTCAGGCTATCCCT 

^^'?^GGC??CA GCCCTG.CTG TATCTACCCA GGGACCTACC TGCCTGCTTT 

°'JcT?cCT?cG tgtctgggtc cccagagagc tgccggcata GGCCTTTGAG 
^Sca'ggc cAGGcrrccc atgctctggc tagcagattc tctgccctgg 
''^ctgS^ggtt tctctcactg ctgcaacagt cagagctggc ccacacgggc 

^^J^???S^TCT GGGTCTCCCT GAGAATGCCG CTGTTnCTG AGAACCCTTG 
^i5?f?AT'cAG GTCTTmGT CAGCTGCGCT TTGGGGGATG AACTTTGCTC 
^^l^it^AGAG GGTAAAGATT TGGTGGCAAC CGGTAGCTAG AGAAAGATAG 
^'?SmG Ja^gg ACATGGCTTC TGGAAAACCT CTCTAGTGCT TTTCTGGCTA 
^'S?T^TG CTCTGATAGC CAGCCCGGGT GATGCAGGGC TTCCTGTTCG 
^°g?aJa'I^tt AGTGAGACAT TGCCTCAAAA ctatgaaaca AGCCAGACTC 
'^Sc'^m^T CCCAGCACTC AGGAGGCTGA AGCAGGCAAG ATCTCTGrrA 
°H?S?rCAGG AAAGTTCTAC AACAGCAGAG GCCAGACAGT GCAACCCTTT 

^ISISaaaacccaacaaaaacaca^ctataaaacaaagagaaggcc 

°^???A^TG CATACTTCCC TTTCTATGTG AAGCCCTGGG CTCCACCAGT 
n^G?^C A ATGAGGGACA GGAGGTTGGC TCTAGGCCCA GGGGTTGTCA 
^IggI^c"^^^ GCAGCCTGAT GTCTGTTTTT ATAAACAAAA TTTTArrGGC 

^^?a^S??Jag ctaggctatt ttcattacaa tagaggccat atggtctgta 

"^T^^l^^CT GCTGTTTTAC ATAAAAAGTT GACAGACTCT TGCTCTAGAC 

"^c?JJgIcItt gttttctgag gttcaagttt cagaggggtc tctgcagcaa 

°^???G?5t?GG TCATGCTATG ATGTCTAGGG TCCCCTCAGA GTGGAAGGCC 
'•"SI^GMGIA AAGTAACTTG CTGGCTCTTT GTrCTTTTCT CCACACTCTA 

TACTTTAGCT 

CTGCCTCAAC ATG 
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(2) INFORMATIONS POUR LA SEQ ID NO: : 

(1) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 785 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (^nomique) 

(iii) HYPOTHETIQUE: NON 

[vi) ORIGINE: 

(A) ORGANISME: SOUR IS 



(xi) DESCRIPTION- DE LA SEQUENCE; SEQ ID NO:? 



GGGCCCCAGG 


AATGTGTTTC 


CTTCTCTCCA CCATGTTTTT 


ATA^CTCTTG 


GGCTGGGAGA 




AGAGGCGG6T 


CTGGGTCTTT 


GTTTCTGAGC 


TTTGTTCTAT 


GTTCCTCCAT GCTACGGTTG 




CAATTCTTTT 


CTATGAACGA 


GTACATTCAA 


TAAAGACAAC 


CAGACCTGGG 


ATTTGGGGTC 


1£ 


TTACTGATGT 


GTTGGGAGGT 


GCAGGAGCCT 


CCGTGTCCCA 


TTTATTTTGG 


CCTTCCCGTC 


2< 


XCGTTTCTGT 


GCGTGGCTAC 


ATTGGGAATG 


ACCTTCCTTG 


ATCCCACCAA 


GCCACCCATT 


3C 


GATTCTGTAA 


ACATGTGACC 


CTTGCTCCAA 


GCATTGCTTA 


CAGGAGCAGG 


ATACTGAAAG 


3€ 


TGTGTCTGTG 


CCCTCTCCTG 


ATAACCCCTC 


CCTTCAGCAG 


GCACACAGCA 


CCTGACTACC 


4: 


CACCACGTAT 


GTAAACGTCA 


GTATCCTTTC 


CAGCCAGCTC 


TGCAGATGGG 


TGTCCAGGCT 


4t 


GTGCATGATG 


CACCTCAAGT 


GGGCAGAGCT 


TGCAGGCCAA 


GGTTTTAAAG 


GCTGTTCAGG 


5^ 


AATGGATGGC 


AAGCAGGATC 


TAAGAGGAGG 


GGGGGTTGTT 


GTTGTTTGGG 


GGGGGGGTGG 


6C 


TTTTGGTTTG 


TTTTTTTTGA 


GACAGGGTTT 


CTCTGTGTGG 


CCCTGGCCCT 


CCTGGAACCC 


6{ 


ACTCTGTAGA 


CCAGGCTGGC 


CTTGAACTCA 


GAAATCTGCC 


TGCCTCTGCC 


TCCCGAGTGC 


7: 


TGGGATTAAA 


GGCGTGTGCC 


CATCGAGGAG 


GGAGATTTTA 


TTTAGATTAT 


AAAAAGGACG 


7E 

7£ 



GGATT, 
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REVENDICATIONS 

1. Sequence d'ADN caracterisee en ce qu'elle comprend : 

- un fragment de la sequence en amont de la partie codante du 
5 gene de la proteine SM22, ou d'une sequence hybridant dans des 

conditions de forte stringence a ladite sequence en amont, ledit 
fragment etant susceptible d'induire une expression specifique d'un 
gene dans des cellules eucaryotes, et 

- une sequence codant pour une proteine, ou un ARN, d'interet 
10 therapeutique. 

2. Sequence d'ADN selon la revendication 1, caracterisee en ce 
qu'elle comprend : 

- un fragment de la sequence en amont de la partie codante du 
gene de la proteine SM 22, ou d'une sequence hybridant dans des 

15 conditions de forte stringence a ladite sequence en amont, ledit 
fragment etant susceptible d'induire une expression specifique in vivo 
d'un gene dans les cellules des arteres, et 

- une sequence codant pour une proteine, ou un ARN, d'interet 
therapeutique. 

20 3. Sequence selon Tune des revendications 1 ou 2, caracterisee en 

ce que ladite proteine . ou ledit ARN. est susceptible d'inhiber la 
croissance des cellules du muscle lisse, d'activer la croissance des 
cellules endotheliales, de consolider les parois des arteres et/ou 
d'induire une reponse immunitaire. 

25 4. Sequence selon i'une des revendications 1 a 3, caracterisee en 

ce que ledit fragment est compris dans la sequence situee entre les 
nucleotides -2126 et +4135 du gene de souris de la proteine SM22 
(SEQ IDnM.) 

5. Sequence seton Tune des revendications 1 a 4, caracterisee en 
30 ce que ledit fragment est compris dans la sequence situee entre les 

nucleotides - 2126 a +65 du gene de souris de la proteine SM 22 (SEQ 
ID N'*2). 

6. Sequence selon Tune des revendications 1 a 5 caracterisee en 
ce qu'elle contient au moins une partie de la sequence situee entre les 
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nucleotides -2126 et -445 du gene de la souris de la proteine SM 22 
(SEQ IDN" 3). 

7. Sequence selon Tune des revendications 1 a 6, caracterisee en 
ce que ladite proteine d'interet therapeutique est une proteine induisant 

5 la formation d'un compose cytotoxique. 

8. Sequence selon la revendication 7, caracterisee en ce que ladite 
proteine est la thymidine kinase du virus de I'herpes. 

9. Sequence selon I'une des revendications 1 a 6, caracterisee en 
ce que ladite proteine d'interet therapeutique presente un effet 

10 cytostatique. 

10. Sequence selon Tune des revendications 1 a 6 caracterisee en 
ce que ladite proteine d'interet therapeutique presente une activite 
iipolytique. 

11. Sequence selon la revendication 10, caracterisee en que ladite 
15 proteine est la lipoproteine lipase. 

12. Sequence selon I'une des revendications 1 a 6, caracterisee en 
ce que ladite proteine d'interet therapeutique est un facteur de 
croissance des cellules endotheliales. 

13. Sequence selon la revendication 11» caracterisee en ce que 
20 ledit facteur est une interleukine. 

14. Sequence selon Tune des revendications 1 a 6, caracterisee en 
ce que ladite proteine d'interet therapeutique est une proteine 
musculaire ou de structure tissulaire. 

15. Sequence selon Tune des revendications 1 a 6, caracterisee en 
25 ce que TARN d'interet therapeutique est I'ARN antisens de la proteine 

p53. 

16. Sequence d'ADN situee en amont de la partie codante du gene 
de souris de la proteine SM 22 caracterisee en ce qu'elle comprend au 
moins une partie de la sequence SEQ ID N^5 suivante. ou une 

30 sequence s'hybridant avec celle-ci dans des conditions stringentes : 

GGGCCCCAGG AATGTGTTTC CTTCTCTCCA CCATGTTTTT 

ATAGCTCTTG GGCTGGGAGA AGAGGCGGGT CTGGGTCTTT 

GTTTCTGAGC TTTGTTCTAT GTTCCTCCAT GCTACGGTTG 

55 CAATTGTTTT CTATGAACGA GTACATTCAA TAAAGACAAC 
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CAGACCTGGG ATTTGGGGTC TTACTGATGT GTTGGGAGGT 

GCAGGAGCCT CCGTGTCCCA TTTATTTTGG CCTTCCCGTC 

TCGTTTCTGT GCGTGGCTAC ATTGGGAATG ACCTTCCTTG 

ATCCCACCAA GCCACCCATT GATTCTGTAA ACATGTGACC 

5 CTTGCTCCAA GCATTGCTTA CAGGAGCAGG ATACTGAAAG 

TGTGTCTGTG CCCTCTCCTG ATAACCCCTC CCTTCAGCAG 

GCACACAGCA CCTGACTACC CACCACGTAT GTAAACGTCA 

GTATCCTTTC CAGCCAGCTC TGCAGATGGG TGTCCAGGCT 

GTGCATGATG CACCTCAAGT GGGCAGAGCT TGCAGGCCAA 

10 GGTTTTAAAG GCTGTTCAGG AATGGATGGC AAGCAGGATC 

TAAGAGGAGG GGGGGTTGTT GTTGTTTGGG GGGGGGGTGG 

TTTTGGTTTG I I I I I I I i GA GACAGGGTTT CTCTGTGTGG 

CCCTGGCCCT CCTGGAACCC ACTCTGTAGA CCAGGCTGGC 

CTTGAACTCA GAAATCTGCC TGCCTCTGCC TCCCGAGTGC 

15 TGGGATTAAA GGCGTGTGCC CATCGAGGAG GGAGATTTTA 
TTTAGATTAT AAAAAGGACG GGATT 

17. Sequence d'ADN situee en amont de la partie codante du gene 
de la souris de la proteine SM22, caracterisee en ce qu'elle comprend 
20 au moins une partie de la sequence SEQ ID n* 1 suivante, ou une 
sequence s'hybridant avec celle-ci dans des conditions stringentes : 
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GGCjCCCCAGGAA 

TGTGTTTCCT TCTCTCCACC ATGTTTTTAT AGCTCTTGGG 
CTGGGAGAAG AGGCGGGTCT 

GGGTCTTTGT TTCTGAGCTT TGTTCTATGT TCCTCCATGC 
TACGGTTGCA ATTGTTTTCT 

ATGAACGAGT ACATTCAATA AAGACAACCA GACCTGGGAT 
TTGGGGTCTT ACTGATGTGT 

TGGGAGGTGC AGGAGCCTCC GTGTCCCATT TATTTTGGCC 
TTCCCGTCTC GTTTCTGTGC 

GTGGCTACAT TGGGAATGAC CTTCCTTGAT CCCACCAAGC 
CACCCATTGA TTCTGTAAAC 

ATGTGACCCT TGCTCCAAGC ATTGCTTACA GGAGCAGGAT 
ACTGAAAGTG TGTCTGTGCC 

CTCTCCTGAT AACCCCTCCC TTCAGCAGGC ACACAGCACC 
TGACTACCCA CCACGTATGT 

AAACGTCAGT ATCCTTTCCA GCCAGCTCTG CAGATGGGTG 
TCCAGGCTGT GCATGATGCA 

CCTCAAGTGG GCAGAGCTTG CAGGCCAAGG TTTTAAAGGC 
TGTTCAGGAA TGGATGGCAA 

GCAGGATCTA AGAGGAGGGG GGGTTGTTGT TGTTTGGGGG 
GGGGGTGGTT TTGGTTTGTT 

TTTTTTGAGA CAGGGTTTCT CTGTGTGGCC CTGGCCCTCC 
TGGAACCCAC TCTGTAGACC 

AGGCTGGCCT TGAACTCAGA AATCTGCCTG CCTCTGCCTC 
CCGAGTGCTG GGATTAAAGG 

CGTGTGCCCA TCGAGGAGGG AGATTTTATT TAGATTATAA 
AAAGGACG<jG ATTTGGGGAA 

TCCTGTCTAG TGAATTCAGG ACGTAATCAG TGGCTGGGAA 
GCAAGAGCTC TAGAGGAGCT 

CCAGCTTATT ATGACCCTTC CTTCAGATGC CACAAGGAGG 
TGCTGGAGTT CTATGCACCA 

ATAGCTTAAA CCAGCCAGGC TGGCTGTAGT GGATTGAGCG 
TCTGAGGCTG CACCTCTCTG 

GCCTGCAGCC AGTTCTGGGT GAGACTGACC CTGCCTGAGG 
GTTCTCTCCT TCCCTCTCTC 

TACTCCTTCC TCCCTCTCCC TCTCCCTCTC TGTGTTTCCT GAGGTTTCCA 
GAATTGGGGA 

TGGGACTCAG AGACACCACT AAAGCCTTAC CTTTTAAGAA 
GTTGCATTCA GTGAGTGTGT 

GAGACATAGC ACAGATAGGG GCAGAGGAGA GCTGGTTCTG 
TCTCCACTGT GTTTGGTCTT 

GGGTACTGAA CTCAGACCAT CAGGTGTGAT AGCAGTTGTC 
TTTAACCCTA ACCCTGAGCC 

TGTCTCACCT GTCCCTTCCC AAGACCACTG .-sj^GCTAGGTG 
CAAGATAAGT GGGGACCCTT 

TCTGAGGTGG TAGGATCTTT CACGATAAGG ACTATTTTGA 
AGGGAGGGAG GGTGACACTG 

TCCTAGTCCT CTTACCCTAG TGTCTCCAGC CTTGCCAGGC 
CTTAAACATC CGCCCATTGT 

CACCGCTCTA GAAGGGGCCA CCCTTGACTT GCTGCT.AAAC 
AAGGCACTCC CTAGAGAAGA 
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GTCCACTGTA GGCAGATAGG TGACAGGTGO CAGATAGGTG 
ACAGATAGGT GACAGGTGGA 

GGAGCTTTGG AACTGGGACT GGACAGCCCT GGGACCCTGT 

tcctcccaaa gggtcttggt 
ggttcccctt ggggctctct aaaggatgtc agtgggctgt 

TGCCACATCT ATATAAGAGG 

actagtcttc tggaatttag gtgtgatctc tcagggatgc 
agaaatgctc acccttactg 

tcattttatg ggctgaggta ccacaggcag atataccctg 
gtctgcttgt tgtccagggt 

ctctgctaca tggaggcccc tttccacagc ct.aacctctc 
tacctgctga caggagggct 

GGATGGCCAC AGGCATCCAA CGTGCGCATC ATGCAGGTGT 
TTTGCGTTGG AGCTTTTGTC 

TAGAAATACC CTGGTGGGCT GCCAAACCAC CACCCATATC 

cctctctcct c.tctgctgcc 
TCTAAGATGA cagcttgatt tttcttatag tgattttttt ttttggtttt 

GTTTTTTTGT 

ttgttttaag ttagcataca aagtaataca tttcatcatg 
gcatttggac atacatatat 

ATTTTATTTG CTCTCCTGGC CTCTTCTCAA AGAGACTTCT CTGGACTTTC 
TTGTATTTTT 

GGTTGTGAGC CTAGCCTTTA ACGGCTGAGC CATCTCTCCA 
GCCCTTCTTT GGACTTTCTA 

CTTCATACTT CCCACCAGTC TGGGAAGAAG GGCACATGGA 
ATCTTGAGAG CATGACCTGA 

CCCAGACCTG ACAGATGTCA AGGCTGCAGT GTATGCTCTT 
GTTCGTACGG CTTGTTCTTA 

GTCCTGCAGT TCAGAACTTT CTGGAGACTG AGAAGTGCAT 
GTGAGGACAC TCTCCTCCCA 

TCTTTTCCTC TAGTGGCTAG TGATGTTTGG TTTTTTGTTT 
TGAGACAGGG TTTCTCTGTA 

TAGCCCTAGC TATCCTGGAA CTCACTTTGT AGATCAGGCT 
GGCCTCCAAC TCAGAAATCT 

GCCTGCCTCT GCCTCCCGAG TGCTGGGACT AAAGGCGTGC 
GCCACCACTG TCCAGTCAGG 

AGTAGAAGGA AACTGTAAGG TGCTTGAGAC AGGCTGAGTA 
GAGGCTAGGA GGAAGGGGCA 

CCGCAGTCAC CGGCTCCATG ACTCTGTGAC TTTTGTGGTT 
CCTTGTCGCA GCGGTTCCTG 

GTGGTGGTGG TGGTCGGGGG TTGGGGGGAG GGGGCAGGCC 
ACACAGTGGG GTGTGGGAGG 

GAATAGCTGT TGACAACTTC CCAACAGAAA CCAGGCTTTT 
GAGTCCTCCA GGGTAGCTTG 

AGAGGGTACT CAGAAAGCCG TGTCCATGTC CCCTTTCCTT 
CACCTCAGGG AAGTAAGTTG 

CCTATAGGGT TGTCATTTCA ATGAGGTCTT CTGGTTATTC TGTTTTTCTC 
TCAATGTTGG 

TGTTGGGCTC AGGGAATGCT TTGGAGAAGG TGGTGGG.^C 
TGGAGAAGGG AAGATCAGTT 



wo 97/35974 PCr/FR97/00543 

58 

TACCATACCT GTGGGCAGGA TGACCCATGT TCTGCCATGC 
ACTTGGTAGC CTTGGAAAGO 

CCACTTTGAA CCTCAATTTT CTCAACTGTT AAATGGAGTG 
GTAACTGCTA TCTCATAATA 

AAGGGGAACG TGAGGAAGGC GTTTGGATAG TGCCTGGTTG 
CGGCCAGGCT GCAGTCAAGA 

CTAGTTCCCA CCAACTCGAT TTTAAAGCCT TGCAAGAAGG 
TGGCTTGTTT GTCCCTTGCA 

GGTTCCTTTG CTCGGCCCAA ACTCTAGAAT GCCTCCCCCT 
TTCTTTCTCA TTGAAGAGCA 

GACCCAAGTC CGGGTAACAA GGAAGGGTTT CAGGGTCCTG 
CCCATAAAAG GTTTTTCCCG 

GCCGCCCTCA GCACCGCCCC GCCCCGACCC CCGCAGCATC 
TCCAAAGCAT GCAGAGAATG 

TCTCCGGCTG CCCCCGACAG ACTGCTCCAA CTTGGTGTCT 
TTCCCCAAAT ATGGAGCCTG 

TGTGGAGTGA GTGGGGCGGC CCGGGGTGGT GAGCCAAGCA 
GACTTCCATG GGCAGGGAGG 

GGCGCCACGG GGCGGCAGAG GGGTGACATC ACTGCCTAGG 
CGGCCTTTAA ACCCCTCACC 

CAGCCGGCGC CCCGGCCCGT CTGCCCCAGC CCAGACACCG 
AAGCTACTCT CCTTCCAGTC 

CACAAACGAC CAAGCCTTGT AAGTGCAAGT CATGGGAGCA 
GAAGGGCTGT GGGCTCAATT 

AGATCCCCTA GTCTCTTCTA GTTTGCTGGG TGGAATTG<}G 
TCCCTAGAGA CCATTCTCTG ^ 

TGTTAGACAA AAAGTCTGGG TTAAAATGCC TAGGATGATT 
TGACTGGG<}C AAAAGAATAA 

ATGGGGTGAG AGGGAGGCTC AAATTCAGTC ACTGTCCCAC 
CCATAGGTGT ATGGGCTATG 

TGTTAGGCCC AAAGAGGTGA CAAATGAGGC CAAGGGAACA 
ACTCCATCTTTGGATCTCCA 

AGAAGGTGAG GGGCT.AAGTT CTGGAAAGCA GTGACCCACT 
GATGGTCCCC AGGGCTAATG 

CAACTCGGGG GAGCCAGGAG GTAGCCCCCT CAGGCAGTGG 
AGOACTAAAG ATCTTATTTT 

TTGTAGCGCT AGGGATCAAA CCCCAGGGCG CTATGTGTGG 
CAGGCATGTG CTCCATCTAC 

CACAGAAGTT TAATCCTTCA GACTAGCCTG GGATAGGGCC 

TGCTTTTTCT TTCCTTTTCT ^n-o^r^-rrTTx 
CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCTCTTT 

CTTTCCTTTT 

CTCTCTTTCA CTCTCTCTTT CTAATTTCTT TTTCTTTTTT TCTTTCTTTT 
CTTTAGACAG 

GGTTTCTCTG TGTAGCCCTG GCTGTTCTGG .\ACTCACTCT 
TTAGACCAGG CTGGCCTCGA 

ATCTCAGAAA TCTACCTGCC TCTGCCTCCC AAGTGCTGGG 

ATTAAAGGCG TGTGCCACCA ^^^^^^-r r 

CTGCCCAGCT AAGGTTTGCT TTTTGATGGC AGCTTGGTCC 
AGTTTGAAAG TAGGAGGTCA 
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TACTGTGTAA ACTCACTGGT TAAAGTACCC CCTCCCTTCC 
ACCCTGCAAT ACACACACAC 

ACACACACAC ACACACACAC ACACACACAC ACCCCATCTC 
GAAGAGCTCT ATTAAGCTCC 

AGGTGCACTG TAGTTCACAG ACTGCATCTT CCAGGTTTGC 
TCCCACTTCA CAAGCAGAGA 

ACTCATAACT GAAGGGGGTG ACAGCACAGG GGAAGGGAAA 
GCAAGATGTT TAGAGTCTGA 

CAGCTGGCCC GGGACCAGAG CCATGTGGTA ATGTTTGCTC 
CACTCCCATC CACCTCCACG 

GCTGTGATGT GGAGAAGGTC CCCGCTTTCA TGGGAAGGAG 
GTG<3GGGAGC CTGTCATCTG 

CTCCATGCTC ACACAATTTT TCTCTCAACC AATGACCTCT 
CAGAAGCAGG GGTTGGTTTG 

CAAAATTCTT CAGATACCTC AACAGATGGC ATCCCACTCA 
GGCTATCCCT GCTGACTAGG 

TCTGGCTCCA GCCCTGACTG TATCTACCCA GGGACCTACC 
TGCCTGCTTT GCTCCTATAG 

CCTTCCTCCG TGTCTGGGTC CCCAGAGAGC TGCCGGCATA 
GGCCTTTGAG GCAACAGCTG 

GCATACAGGC CAGGCTTCCC ATGCTCTGGC TAGCAGATTC 
TCTGCCCTGG AGGACTTTGA 

CTGCATGGTT TCTCTCACTG CTGCAACAGT CAGAGCTGGC 
CCACACGG<JC ACAACAGCGC 

ACTTCCATCT GGGTCTCCCT GAGAATGCCG CTGTTTTCTG 
AGAACCCTTG GACTCTGGTG 

GCTTTATCAG GTCTTTTTGT CAGCTGCGCT TTGGGGGATG 
AACTTTGCTC TTCTGGCTTC 

TGGGTCAGAG GGTAAAGATT TGGTGGCAAC CGGTAGCTAG 
AGAAAGATAG CTACTGGCTG 

AATTTGGAGG ACATGGCTTC TGGAAAACCT CTCTAGTGCT 
TTTCTGGCTA GTCTTGGCAA 

AGTAAAAATG CTCTGATAGC CAGCCCGGGT GATGCAGGGC 
TTCCTGTTCG AGGCCTTTCT 

GTACAAAATT AGTGAGACAT TGCCTCAAAA CTATGAA.ACA 
AGCCAGACTC TGTTGAAGCA 

CGCCTTTAAT CCCAGCACTC AGGAGGCTGA AGCAGGCAAG 
ATCTCTGTTA GTTGGAGGCC 

AGTCTACAGG AAAGTTCTAC AACAGCAGAG GCCAGACAGT 
GCAACCCTTT CTGGGGGTGT 

GGGGGAGGAA AACCCAACAA AAACACAAAC TATAAAAC.-^A 
AGAGAAGGCC GAGGACAAAG 

CTTAGCAATG CATACTTCCC TTTCTATGTG AAGCCCTGGG 
CTCCACCAGT ACTGCAGAA.A. 

GAAGCAAGCA ATGAGGGACA GGAGGTTGGC TCTAGGCCCA 
GGGGTTGTCA AAATAGTCCA 

CAGGCCAAAG GCAGCCTGAT GTCTGTTTTT ATAAAC.AAAA 
TTTTATTGGC ACACATTGGT 

TATGTATCAG CTAGGCTATT TTCATTACA.\ TAGAGGCCAT 
ATGGTCTGTA AAGTCTAAAA 
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TATTTACTCT GCTGTTTTAC ATAAAAAGTT GACAGACTCT 
TGCTCTAGAC TGACAAATAT 

CTAAGACCTT GTTTTCTGAG GTTCAAGTTT CAGAGGGGTC 
TCTGCAGCAA GTGGGTAAAG 

CTGGTCTAGG TCATGCTATG ATGTCTAGGG TCCCCTCAGA 
GTGGAAGGCC TGCTTAGCAC 

AAATGAAGTA AAGTAACTTG CTGGCTCTTT GTTCTTTTCT 
CCACACTCTA TACTTTAGCT 

CTGCCTC 
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18. Sequence d'ADN situee en amont de la partie codante du 
gene de la souris de la proteine SM22 caracterisee en ce qu'elte 
comprend au moins une partie de la sequence SEQ ID n° 2 sutvante. ou 
une sequence s hybridant avec celle-ci dans des conditions stringentes 









SEQ ID 


NO: 2 : 






GGGCCCCAGG 


AATGTGTTTC 


CTTCTCTCCA 


CCATGTTTTT 


ATAGCTCTTG 


GGCTGGGAGA 




AGAGGCGGGT 


CTGGGTCTTT 


GTTTCTGAGC 


TTTGTTCTAT 


GTTCCTCCAT 


GCTACGGTTG 


1 


CAATTGTTT7 


CTATGAACGA 


GTACATTCAA 


TAAAGACAAC 


CAGACCTGGG 


ATTTGGGGTC 


1 


TTACTGATGT 


GTTGGGAGGT 


GCAGGAGCCT 


CCGTGTCCCA 


TTTATTTTGG 


CCTTCCCGTC 


2 


TCGTTTCTGT 


GCGTGGCTAC 


ATTGGGAATG 


ACCTTCCTTG 


ATCCCACCAA 


GCCACCCATT 


3 


GATTCTGTAA 


ACATGTGACC 


CTTGCTCCAA 


GCATTGCTTA 


CAGGAGCAGG 


ATACTGAAAG 


3 


TGTGTCTGTG 


CCCTCTCCTG 


ATAACCCCTC 


CCTTCAGCAG 


GCACACAGCA 


CCTGACTACC 


4 


CACCACGTAT 


GTAAACGTCA 


GTATCCTTTC 


CAGCCAGCTC 


TGCAGATGGG 


TGTCCAGGCT 


4 


GTGCATGATG 


CACCTCAAGT 


GGGCAGAGCT 


TGCAGGCCAA 


GGTTTTAAAG 


GCTGTTCAGG 


5 


AATGGATGGC 


AAGCAGGATC 


TAAGAGGAGG 


GGGGGTTGTT 


GTTGTTTGGG 


GGGGGGGTGG 


6 


TTTTGGTTTG 


TTTTTTTTGA 


GACAGGGTTT 


CTCTGTGTGG 


CCCTGGCCCT 


CCTGGAACCC 


S 


ACTCTGTAGA 


CCAGGCTGGC 


CTTGAACTCA 


GAAATCTGCC 


TGCCTCTGCC 


TCCCGAGTGC 


7 


TGGGATTAAA 


GGCGTGTGCC 


CATCGAGGAG 


GGAGATTTTA 


TTTAGATTAT 


AAAAAGGACG 


7 


GGATTTGGGG 


AATCCTGTCT 


AGTGAATTCA 


GGACGTAATC 


AGTGGCTGGG 


AAGCAAGAGC 


8 


TCTAGAGGAG 


CTCCAGCTTA 


TTATGACCCT 


TCCTTCAGAT 


GCCACAAGGA 


GGTGCTGGAG 


9 


TTCTATGCAC 


CAATAGCTTA 


AACCAGCCAG 


GCTGGCTGTA 


GTGGATTGAG 


CGTCTGAGGC 


9 


TGCACCTCTC 


TGGCCTGCAG 


CCAGTTCTGG 


GTGAGACTGA 


CCCTGCCTGA 


GGGTTCTCTC 


10: 


CTTCCCTCTC 


TCTACTCCTT 


CCTCCCTCTC 


CCTCTCCCTC 


TCTCTGTTTC 


CTGAGGTTTC 


lOv 
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CAGAATTGGG GATGGGACTC - 


rtGAGACACCA 


CTAAAGCCTi 


ACCTTTTAAG 


AAGTTGCATT 


11-; 


CAGTGAGTGT I 


GTGAG.-.CATA 


GCACAGATAG 


GGoCrtbAoLjH 


GAGCTGGTTC 


TGTCTCCACT 


12( 


GTGTTTGGTC ' 


TTGGGTACTG 


AACTCAGACC 


ATCAGGTGTo 


ATAGCAGTTG 


TCTTTAACCC 


12( 


TAACCCTGAG 


CCTGTCTCAC 


CTGTCCCTTC 


CCAAGACCAC 


THAAGCTAGG 


TGCAAGATAA 


13: 


GTGGGGACCC 


TTTCTGAGGT 


GGTAGGATCT 


TTCACGATAA 


rrarTATTTT 


GAAGGGAGGG 


13f 


AGGGTGACAC 


TGTCCTAGTC 


CTCTTACCCT 


AGTGTCTCCA 


-^-mrrrrCAG 


GCCTTAAACA 


14^' 


TCCGCCCATT 


GTCACCGCTC 


TAGAAGGGGC 


CACCCTTGAC 




ACAAGGCACT 


15C 


CCCTAGAGAA 


GATACCATAC 


CTGTGGGCAG 


G ATGAL- L. /i 1 


GTTCTGCCAT 


GCACTTGGTA 


15^ 


GCCTTGGAAA 


GGCCACTTTG 


AACCTCAATT 


TTCTCAACTG 


TTB A ATGGAG 


TGGTAACTGC 


16: 


TATCTCATAA 


TAAAGGGGAA 


CGTGAGGAAG 


GCGTTTGGAT 


AGTUt-w io*-'-*' 


TGCGGCCAGG 


16E 


CTGCAGTCAA 


GACTAGTTCC 


CACCAACTCG 


ATTTTAAAGC 




GGTGGCTTGT 




TTGTCCCTTG 


CAGGTTCCTT 


TGCTCGGGCC 


AAACTCTAGA 


ATGCCTCCCC 


CTTTCTT ru i 


1 0 r 


CATTGAAGAG 


CAGACCCAAG 


TCCGGGTAAC 


AAGGAAGGGT 


TTCAGGGTCL. 


TPr'pr' AT AAA 


IBt 


AGGTTTTTCC 


CGGCCGCCCT 


CAGCACCGCC 


CCGCCCCGAC 


CCCCGCAGCA 


fTip rrnn AAA rzc 


192 


ATGCAGAGAA 


TGTCTCCGGC 


TGCCCCCGAC 


AGACTbL. ILL 




CTTTCCCCAA 


19£ 


ATATGGAGCC 


TGTGTGGAGT 


GAGTGGGGCG 


GCCCGGGGTG 


GTGAGCCAAG 


CAGACTTCCA 


^ u *« 


TGGGCAGGGA 


GGGGCGCCAC 


GGGGCGGCAG 


AGGGGTGACA 


TCACTGCCTA 


GGCGGCCTTT 


21c 


AAACCCCTCA 


CCCAGCCGGC 


GCCCCGGCCC 


GTCTGCCCCA 


GCCCAGACAC 


CGAAGCTACT 


216 


CTCCTTCCAG 


TCCACAAACG 


ACCAAGCCTT 






21£ 
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19. Souche deposee le 25 mars 1996 aupres de la CNCM sous le 
0^*1-1685 portant le plasmide p2126nlz comprenant la sequence selon la 
revendication 18. 

20. Souche deposee le 25 mars 1996 aupres de la CNCM sous le 
> 1-1686 portant le plasmide p2126INTnlz comprenant la sequence 

selon la revendication 17. 

21. Vecteur caracterise en qu*il contient une sequence selon Tune 
des revendications 1 a 16. 

22. Vecteur selon la revendication 20. caracterise en ce qu'il 
10 contient une origine de replication efficace dans les cellules des arteres. 

23. Vecteur selon I'une des revendications 21 et 22 caracterise en 
ce qu'il est un derive d'un adenovirus. 

24. ARN caracterise en ce qu*il est capable d'etre exprime par une 
sequence ou un vecteur selon I'une des revendications 1 a 23. 

15 25. Composition caracterisee en ce qu'elle contient une sequence 

ou un vecteur selon i'une des revendications 1 a 16 et 21 a 23. 

26. Composition selon la revendication 25, caracterisee en ce que 

la sequence ou le vecteur sont compris dans une composition facilitant 

leur transfection dans les cellules. 
20 27. Composition selon la revendication 25, caracterisee en ce 

qu'elle comprend un gel qui est un complexe de poly-L-lysine et de 

lactose. 

28. Medicament caracterise en ce quMt contient une sequence ou 
un vecteur selon I'une des revendications 1 a 16 et 21 a 23. 
25 29. Composition pharmaceutique caracterisee en ce qu'elle 

contient une quantite pharmaceutiquement efficace d'une sequence 
nucleique ou d'un vecteur selon I'une des revendications 1 a 16 et 21 a 
23, et des excipients pharmaceutiquement compatibles. 

30. Utilisation d'un vecteur ou d'une sequence selon I'une des 
:o revendications 1 a 16 et 21 a 23 pour la fabrication d'un medicament 

pour le traitement des maladies coronariennes. 

31. Utilisation d'un vecteur ou d'une sequence selon I'une des 
revendications 1 a 16 et 21 a 23 pour la fabrication d'un medicament 
pour le traitement de la restenose. 
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32. Utilisation d'un vecteur ou d'une sequence selon Tune des 
revendications 1 a 16 et 21 a 23 pour la fabrication d'un medicament 
pour le traitement des mutations fragiiisant les vaisseaux. 

33. Animaux transgeniques caracterises en ce qu'ils portent une 
5 sequence ou un vecteur seton Tune des revendications 1 a 16 et 21 a 

23, dans lequel le gene codant pour la proteine d'interet therapeutique 
est remplace par un gene reporteur. 

34. Procede de criblage de molecules in vitro pour leur activite sur 
les sequences regulatrices du gene codant pour la proteine SM22 

10 comprenant les etapes suivantes: 

- transfection de cellules avec une sequence ou un vecteur selon 
rune des revendications 1 a 13 et 21 a 23. dans lequel le gene codant 
pour la proteine d'tnteret therapeutique est remplace par un gene 
reporteur, 

15 - incubation des cellules transfectees avec la molecule a tester, et 

- quantification de I'expression du gene reporteur. 

35. Procede de detection de mutations sur la region comportant la 
sequence seton I'une des revendications 1 a 16 ou le vecteur selon Tune 
des revendications 21 a 23. caracterise par une alteration de 

20 i'expression du gene place en aval de ladite sequence. 

36. Procede d'expression de proteines d'interet therapeutique 
caracterise en ce qu'il met en oeuvre les produits selon i'une des 
revendications 1 a 24. 

25 
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Fig. 1 
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yXT-2 A?-2 



r-bcx 

XACCAGCc:::r:TcccATTT:7TT:GG:cT 



IjACCCTT" 



TCCCGTCTCC . i . CTGTCCGTCCC'-CATTu jCAATwAw • < • "j- 
I I I I *C ACGAGCACGATAC > CAAAGTu i o • w • 



^"iriCAG r''":- :iCTiCCC:C:^CGTA:GTiAACGTCAGTATC:""T:CAGCC^CCTCT:.LLlAl 
i-b=x £-bcx 
IGGCAGAGC7':;AoGCCAAGGT~TT«iACGCTGTTCAGGAATCGATGGCAAGCAGGA*CTA^GiGCAGGGGGGu"GTT: 



A? -2 



i-box 



TTGAGACAGGGTTTCTCTGTGTGGCCCTGGCCCTCCTGGAACCCACTC'GT 



• i I iGGTT I -J ■ 

TGC_CTCTCC : I^^AGTGCTGGGATT iiAGCCGIGTG 



gGu\Juu\:Gvl t Gu 

C C i C-GC 7 GGC : ~G A iCJ C iG - i AT C TG : C 
:7CT 



GCCCATCGAGGAGCGAGATTTTiT7TAGiZliIiii=iC^'^^^^^" .TCGGGAiTCC 
CTCAATTCAGGi:GTAATCACTGG:TGCGAAGCAAGAGCTCTiGAGGAGCTCCAGC7TATTiTGiCCC~CCn'CilLl^ 



nCTATGCACaiTAGCTTAAACCACCCACOCTGCCTGTAGTGGATTCAGCgTCTGAGGCTGCACCTCTGTGGGCTGCAGCCAG. iCTGGGTGACACTGA 

CAtG 

AGACACACCACTAiAGCCnACCTrrrAAGAAGTTGCATTCACTCAGTGTGTGACACATAGCACAGATAGGGGCAGACCACiGC*GGTTC'GT::CCACT 

GTCmGCTC— :::TACTGAAC:C;GACCATrArrvrrTCiTAGai^ 

E-box £-box i-box 

TGAAGCTAGG:::AAGATAAGTGCGGACCCTTTCTGAGGTGCT:CGATCTn-CACGATAAGGAG^ZIILi^GGGAGGG-GGG:GiCACT:T 

KEF -2 

CTCrTACCCTAGTGTCTCCAGCC~GCCAGGCGTT;;iACATCCCGCCA7TGTCACCGCTCTAGAAGGGGCCACC:TTGAC"CGTGGTAAACAAGGCACT 

CCCTAGACAAGATACCATACC7G7GGGCAGGATGACCCATGTTCTGCCATGCALlIiIGTAGC:TTGGAAACGCGACTnGAACCTCAATTTTC'^^ 

E-box -*^°^ 
TTAAATGGACTGGTAAaGGTATCTCATAATAAAGGGGAACGTGACGAACCCGrrrGGATAGTCCCTGGnGCGGCCAGGGTGCAGTCAACACTAGTTCC 

rAffJUrr fcdT-TT&AA GCCmCAAGAACGTCGCT TrrTTGTr crTTCrAGGTTCCTTTGaCGGGCCAAACT 

HEr-2 rGT3-3 
CATTGAACACGJGACCCAAGTCCGGGTAACAAGGAAGGGTrrCAGGCTCCTG GCCATAAAAflf^TTTTTcCC GGgiX^ 

CXrC Spl Spl 

CCCCGaGCATCTCCAAAGCATGCAGAGAATGTCTCCGGaGCCCCCGACAGACTGaCCAACTTGG7GTC~CCrC--^'rA'^(lGAGCCTG7G7GGAGT 

CArG 

GAGT CGGGCGr^''"GGG TCGTGAG:CAAGCAGACTTCCATGGGCAGGGAGGGGCGCCACGGG^lt-l^CAGAGGCGTGACATCAC7GCC7AGGC 
iAACCCCTCACC:AGCCGGCGCCGdGGCCCGTaGCCCCACCCCAGACACCGAACaAaCTCnTCCi:(rrC:ACaAACG:CCAAGCCn 
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3395 Fspl 

950 Hgai 2597 Ecoi? Ill 

311 A«lll 2296 EamnOSl ^^^^ ^ 

237 2118 Kasi 3376 Bal I 42S2 DrA III ^^^^ ' u- ^ .„ 

Apa I 804 EcoR I 1 871 Eag : 3269 Asp718 ^635 ApaL I £770 H.nD m 

H \ I I ' ■ ' U t ! ^ ^ 1 



SM 6259 base pairs Unique Sites 
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105 I 
1 

3&n :* 



^ — 



1 1 ) 

CGGCCCC^iGAATCTGTTTCCrrcrCTCCACCA*: 



I 



CCCGCC3TCCT7ACACAW*GCA^3ACA<:3rGG7Ar^A>-i^TATCGAGAACCCCXCCCTCrrC7CC^ 



I I 

1 

1 

1 

1 



1 

4 j 



?0 



6 
6 

Zdm Z 

t ; 

CTTTCrSXGCrrrCTTCTrtTCTTCCTCCATCCT^CGGTTSCAATTCTTTTCTP.TGX^CCrtGTACATTC^ATAAA 

w AAAG AC 7CG.Sl.«w^CAAG ATAC.W 3^^. SGTAC GAT ?CC »AC CT7AACAA/*.».G r.T AC TTG CTC A'rG7^J\G77 ATTTCTGT T3 



Hie II- BsnA 1 



35 

3st:« I 

I ! ; I I 

CAGACCTGGGATTT0G-:-GTC?TAC7CA7G7G7T:rGGAGG7oCAGGACCC?CCCTGTCCCAT77Ar?rrGG7C77CCCC7C 
Cj7C7GG;irCC7AAACCCC».GAArCAC7A"ACAACCCTCCACGrCCTCG^AGCCACAGGG7.0-?.7>Ju-J.CCG 

I . . . . . . II- II- 

165 229 

Alw I HiTif I nil mZZ 

I I t 

TCGT7TCTCTC<GTGCC7ACA7TGCCAA7<:ACCT7CCrrG\^TCCCACCAAGCC^.CCCATTGAT7C7C?>-VACATC 
A0CA.V^G;XACGCACCCATCTAACCCrrACTCCX^GGAACTAG^GT3G77CGCTCCG7AACTAACACA7TTGTACAC7CG 

I . • t » ( 

230 201 311 



3ec 



8S X 



zcoS"? : 

ICON I 

1 1 

rCCCTTCAGCAG 



1£0 



240 



;20 



:3C 



GAACa?.GG77CG7AACGAATo7CC7CG7CC7A7V3ACrTrCACACAGACACGGCAGACCACTA7TC-GGGAGGGAAG7CG7C 
• • • I * • • ) I * 

EcoF. i: 

Alwil I Alu ; B*--' * 

1 I ' 

GCACACAGCA7CTGACTACGCACCACGrATC7AAACCrrCAGTATCCTTrCCAGCCVGCTCTGCAGATG33TGTC i 3 0 

C GTCTCTCCTGG.'HrTSATG CCTGCTC-CATACATTTGa^GTCAT ACCAAAC37CC-G7C C AC ACCTCTAC7CACACGTC C 0 A 
I • » • • . I • • I • 

4C6 ^155 ^"^^ 

474 

Cde X 
D?a I 

Xlu I HAft I Dra I FoJc I Alw I 

I I) I I II I 

GTCCATCATGCACCTCAACTGGGCAGACCTrxXACGCCAACCrrrTTA^ 5 € 0 

CACC7ACrAC3TMACTTCACCC3TCrcakACGTCC3GTTCCAAAAT7TCCCACJUl^ 

: • 1 1 • I • • I • II' 

501 514 534 544 556 

515 ^56 

557 

S50 
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Hii ii: 
I 

* • • • • ' • 

619 635 

Ha© ::: 



ic 

:: Ec=3i i: escm i 

EgtiJ : =5^i; 1 - - - ■■'^^ ^ 

til 1 » 1 1 ' 

CCCTGGCCCrCC73C--V.CCC^CTCTCCACVJC;.:;CCT33CCTT5XV=TC;^GAA:wCrCCC7GCC7C73CC "^20 

sca\ccG3t^caAccTT3G?7C^GACATCT^CT^CGAcccsxkCTr3^'JTcrr:;■.•5AC0C^.CGCA^;AC30?.3^.3C'rc^.co 

I t" • t • 1 • I 1 1 • . t • • * I 

542 651 555 677 d;7 "'^2 

542 oS: 571 

645 S71 

572 

3SP1255 1 * 

T0CC?TTX.»J^C5CCTCTCCCCJt.TC5ACGACGGAGA-rTrxrrrACArrATA;-^>J^.CCAC3G3 £ c 0 

ArCCT;ATTrCCCC.= CACGC-GTA3CTCC7CCCTCTW-\TXUTCTA;.TA7Trr^ 

1 - • - • • I 

736 

Alu I 

c-su r 
Aiu : Alu ; 
Hoi.*. - HgiA I 

?cc? I AivvN : Sen II Bin i: Zco57 I 

t I II ; I 1 ' > 

AC7(:AAT7C>,GGAC0T.'^J^.7CAGTGGCr;-33;^-^CCAAGA3Cr';TA3AC3AG377CAGC" -^0 
TCACr:X^G7CC7GCA77KG7CACCGACCC77CC7TC7CCA3ATCTCCTC^A337CGA;i.7?-V7>C7GGC>_iGG.^G 

I . I . ! 1 - 1 I . ( I • " • ' 

^C4 =20 S37 243 

337 049 
=37 c48 
&3£ €49 

SSI 

£55 

satK I - 
G«u I Alu I 2gl I liil-i ^ ^ 

; 1 :i ' ' ' 

3CCACAACGA3GTC77o(3?^-TTCTA7CCACCrJ>i7A3C77>AA^CAGCCAC^73GC7GTXGT33A773A3C 9 f 0 
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•C*T7TTAAGAA07TGCX77CACTGAG7373T3ACACATAGCACAGATA3GGCCAGAGGACACC7CC77C7G7C7CCXw. HCO 
7C3AAAA77C77CAACG7XAC7CArrCACACAC?CT57ATCG7GTCTATCCGCG7CTCCTC7CG.\CCAACACACAC5tiA 
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ECOH I - 
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h:a« III 
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Kaa III II 
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II 
Bbe I 
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ACaACCTAaATGaT5TC77CAA;^T7AGGAAGTCTGATC3CACCC7ATCCCS3AC3A?J^-^^^ 
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CACJ^GASAGACAaAah«>^AaAGACAGAGAGX3AaA^AGAAACA^G3AX\A3AGAG 
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AAAAAS;w».\»J^CAAAGAAP^GAAATC7C7CCCAAA<^^ 

|. • • ' • 
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rC'yL I ^DV 

; I ■ 
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CGCCTAC7ACC7CC;CAAAACCGAACCTCGAAAAC».GATC7r7.-.7 



3440 



1 

33E6 



3375 
337S 
3376 
3377 



33S5 
335S 
3336 
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" '\, . .Ill 

3973 litQ 
3B75 

zeoR ;i 
3ftK I 
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l Hae l Dde 1 Ava I ^""-^ - 

CTXCATCAGGCTSCCCTCCAACTCAG^J^XrCTGCCTGCCTCT^CC^^ ^^'^ 
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Kinf I 
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lit • I . 

54>6 5515 

S497 
54?7 
S5CD 
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